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第 一 章 最 低 限 度 的 ruby 知 识 


为 了 方便 第 一 部 分 的 解说 ， 在 这 里 简单 介绍 一 下 ruby 的 基本 知识 。 这 里 不 会 系统 介绍 编程 的 
技巧 方面 的 东西 ， 读 完 这 章节 也 不 会 让 你 掌握 ruby 的 编程 方法 。 如 果 读 者 已 经 有 ruby 的 经 验 ， 
那 就 可 以 直接 跳 过 本 章节 。 


另外 我 们 会 在 第 二 部 分 不 厌 其 烦 地 讲解 语法 ， 于 是 在 这 一 章节 我 们 尽量 不 涉及 语法 相关 内 
容 。 关 于 hash ;literal 之 类 的 表示 方法 我 们 会 采用 经 常 使 用 的 方式 。 可 以 省 略 的 东西 原则 上 我 
们 不 会 省 略 。 这 样 才 会 使 语法 看 起 来 简单 ， 但 是 我 们 不 会 重复 提醒 "这 里 可 以 省 略 "。 


对 象 
字符 串 
ruby 程 序 造 作 的 所 有 东西 都 是 对 象 。 在 ruby 里 面 没 有 如 java 里 面 的 int 或 者 long 一 样 的 基本 数 


据 类 型 。 比 如 ， 如 下 面 的 例子 一 样 书写 的 话 ， 就 会 生成 一 个 内 容 是 "content" 的 字符 串 (String) 
对 象 。 


"content" 
刚才 说 这 个 只 是 个 字符 串 的 对 象 ， 其 实 正确 来 讲 这 个 是 生成 字符 串 对 象 的 表达 式 。 所 以 每 写 
一 次 ， 都 会 有 新 的 字符 串 对 象 生成 。 


"content" 
"content" 
"content" 


这 里 就 生成 了 三 个 内 容 是 "content" 的 对 象 。 


但 是 单纯 有 对 象 程序 是 看 不 到 的 。 下 面 教 你 如 何在 终端 显示 对 象 。 


p("content") # 显 示 "Ccontent" 


"#" 之 后 的 东西 是 注释 。 接 下 这 个 都 表示 注释 。 

Pp(.…...)" 是 调用 了 郊 数 p。 它 能 够 较 允 旧 的 表示 对 象 的 状态 ， 基 本 上 是 一 个 debug 用 的 函数 。 
虽然 严格 意义 上 讲 ，ruby 里 面 并 不 存在 函数 这 个 概念 。 但 是 现在 请 先 把 它 当 作 函 数 来 理解 。 
函数 无 论 在 哪里 都 可 以 使 用 。 

各 种 各 样 的 序列 


接 下 来 我 们 来 说 明 一 下 直接 生成 对 象 的 序列 (literal)。 先 从 一 般 的 整数 和 小 数 说 起 。 


# 整数 

1 

2 

100 

9999999999999999999999999 # 无 论 多 大 的 数 都 可 以 使 用 


1.3e4 # 1.3x10^4 


请 记 住 ， 这 些 也 全 部 是 生成 对 象 的 表达 式 。 在 这 里 我 们 不 厌 其 烦 得 重复 强调 ，ruby 里 面 是 没 
有 基本 类 型 的 。 


下 面 是 生成 数组 对 象 的 表达 式 。 


[1,2,3] 


这 个 程序 会 按 顺 序 生成 包含 1 2 3 三 个 元 素 的 数组 。 数 组 的 元 素 可 以 是 任何 对 象 。 于 是 也 可 以 
有 这 种 表达 式 。 


[1, "string", 2, ["nested", "array"]] 


甚至 ， 下 面 的 用 法 可 以 来 生成 哈 希 表 。 


{"key"=>"value", "key2"=>"value2", "key3"=>"value3"} 


所 谓 哈 硕 表 ， 是 指 任何 的 所 有 对 象 之 间 的 一 对 一 的 数据 结构 。 按 照 上 述 写 法 会 构造 出 包含 下 
面 所 示 关 系 的 一 张 表 。 


"key" ES nyatuwer 
"key2" —» "value2" 
"key3" —» "value3" 


nn 
结果 是 "value"。 那 该 怎么 询问 呢 ? 那 就 要 用 到 方法 了 。 
方法 的 调用 


A 。 用 c++ 的 话说 就 是 调用 成 员 函 数 。 至 于 什么 是 方法 ， 我 觉得 没有 必要 说 
明 ， 还 是 看 一 下 下 面 这 个 简单 的 例子 吧 。 


"content" .upcase() 


符 串 (字符 串 的 内 容 为 "content") 的 upcase 方 法 。upcase 是 返回 一 个 将 所 有 人 小 写 
大 写 的 字符 串 。 于 是 会 有 下 面 的 效果 。 


p("content" .upcase()) # 输出 "CONTENT" 


方法 可 以 连续 调用 


"content".upcase().downcase() 


这 个 时 候 调 用 的 是 "content".upcase() 的 返回 值 对 象 的 downcase 方 法 。 


另外 ，ruby 里 面 没 有 像 Java 和 C++ 一 样 的 全 局 概念 。 于 是 所 有 对 象 的 接口 都 是 通过 方法 来 实 
现 。 


在 ruby 里 面 写 上 一 个 式 子 就 已 经 算是 一 个 程序 了 。 没 有 像 C++ 或 者 Java 一 样 需要 定义 main()。 
p("content") 

仅仅 就 这 样 已 经 算是 一 个 完整 的 ruby 程 序 。 把 这 个 东西 复制 到 first.rb 这 个 文件 中 然后 在 命令 行 

执行 


% ruby first.rb 
"content" 


使 用 选项 -e 可 以 不 需要 创建 文件 就 可 以 执行 代码 。 


% ruby -e 'p("content")' 
"content" 


然而 要 注意 到 的 是 ， 上 面 p 的 位 置 是 程序 中 最 外 层 的 东西 ， 也 就 是 说 在 程序 上 属于 最 上 层 ， 于 
是 被 称 作 顶 层 。 有 层 顶 是 ruby 脚 本 语言 的 最 大 特征 。 


ruby 基 本 上 一 行 就 是 一 句 。 不 需要 在 锯 尾 加 上 分 号 。 所 以 下 面 的 内 容 实 际 上 是 三 个 语句 。 


p("content") 
p("content" ,Upcase() ) 
p("CONTENT". downcase( )) 


执行 结果 如 下 


% ruby second.rb 
"content" 
"CONTENT" 
"content" 


局 部 变量 

ruby 中 所 有 的 变量 和 常量 都 仅仅 是 对 对 象 的 引用 (reference)。 所 以 仅仅 是 带 入 其 他 变量 的 话 并 
不 会 发 生 复制 之 类 的 行为 。 这 个 可 以 联想 到 Java 中 的 对 象 型 变量 ， 以 及 C++ 中 的 指向 对 象 的 
指针 。 但 是 指针 的 值 无 法 改变 。 

ruby 仅 看 变量 的 首 字母 就 可 以 分 别 出 变 量 的 种 类 。 人 小 写 阿 拉 伯 字母 或 者 下 划 线 开始 的 变量 属 
于 局 部 变量 。 使 用 等 于 号 = 代入 赋值 。 


"content" 
[1, 2,3] 


str 
arr 


一 开始 代入 的 时 候 不 需要 声明 变量 ， 另 外 无 论 变 量 是 什么 类 型 ， 代 入 方法 都 没有 区 别 。 下 面 
的 写法 都 是 合法 的 。 


lvar = "content" 
lvar = [1,2,3] 
lvar = 1 


当然 ， 虽 然 可 以 这 么 写 但 是 完全 没有 必要 故意 写成 这 样 。 把 种 类 各 样 的 对 象 放 在 一 个 变量 中 
懂 。 现 实 


会 使 得 代码 变 得 上 涩 难 懂 。 现 实 中 很 少 有 如 此 的 写法 ， 在 这 里 我 们 仅仅 是 举 个 例子 。 


变量 内 容 查询 也 是 常用 的 。 


Str = "content" 
p(str) # 结果 显示 "content" 


下 面 我 们 从 变量 持 有 对 象 的 引用 的 观点 来 看 下 面 的 例子 。 


"content" 
a 
b 


Sy 
JU 


执行 这 个 程序 之 后 ， 变 量 a，b，c 三 个 局 部 变量 指向 的 都 是 同一 个 对 象 ， 也 就 是 第 一 行 生成 
的 "content" 这 个 字符 串 对 象 。 


"content" 


i 


C 
图 1: Ruby 的 变量 拥有 对 对 象 的 引用 


这 里 我 们 注意 到 ， 一 直 在 说 的 局 部 变量 ， 那 么 这 个 局 部 必然 是 针对 某 个 范围 的 局 部 。 但 是 请 
稍 等 片刻 我 们 再 做 解释 。 总 之 我 们 先 可 以 说 顶层 也 是 一 个 局 部 的 作用 域 。 


常量 
名 称 首 字母 是 大 写 的 称 作 常量 。 所 谓 常量 就 是 只 能 代入 赋值 一 次 。 


Const = "content" 
PI = 3.1415926535 


p(Const) # 输出 "content" 


带 入 两 次 的 话 会 发 生 错 误 。 虽 然 按 道理 是 这 样 ， 但 是 实际 运行 的 时 候 却 不 会 有 错误 例外 发 
生 。 这 个 是 为 了 保证 执行 ruby 程 序 的 应 用 程序 ， 比 如 说 在 同一 个 开发 环境 下 ， 读 入 两 个 同样 
的 文件 的 时 候 不 至 于 产生 错误 。 也 就 是 说 是 为 了 实用 性 而 不 得 不 做 出 的 牺牲 ， 万 不 得 已 才 取 
消 了 错误 提示 。 实 际 上 在 Ruby1.1 之 前 是 会 报错 的 。 


了 
2  # 实际 上 只 会 给 出 警告 ， 最 理想 的 还 是 要 做 成 会 显示 错误 


人 
Wl 


接 下 来 ， 被 常量 这 个 称呼 欺骗 的 人 肯定 有 很 多 。 常 量 指 的 是 "一 旦 保存 了 所 要 指向 的 对 象 就 不 
再 会 改变 "这 个 意思 。 而 常量 指向 的 对 象 并 不 是 不 会 发 生变 化 。 如 果 用 英语 来 说 ， 比 起 
constant 这 个 意思 ， 还 是 read only 来 的 比较 贴切 。( 图 2)。 顺 带 一 提 ， 如 果 要 使 对 象 自身 不 发 
生变 化 可 以 用 freeze 这 个 方法 来 实现 。 


变 殷 户 驴 人 变 扣 召 世 上 上 书 动 吾 


2 


图 2 : 常量 是 read only 的 意思 

另外 这 里 还 没有 提 到 常量 的 作用 域 。 我 们 会 在 下 一 节 的 类 的 话题 中 来 说 明 。 

流程 控制 

Ruby 的 流程 控制 结构 很 多 要 列举 的 话 举 不 胜 举 。 总 之 就 介绍 一 下 基本 的 和 while。 
if i < 16 then 


# 内 容 
end 


while i < 10 do 


# 内 容 
end 


在 条 件 语句 中 只 有 false 和 nil 两 个 对 象 是 假 ， 其 他 所 有 对 象 的 都 属于 丨 。 当 然 0 和 空 字符 串 也 是 


oo 


Fee 


顺带 一 提 ， 只 有 false 的 话 感觉 不 怎么 美观 ， 于 是 当然 也 有 true， 当 然 true 是 属于 站 。 


最 纯粹 的 面向 对 象 的 系统 中 ， 方 法 都 是 对 象 的 附属 物 。 但 是 那 毕 竟 只 是 一 个 理想 。 在 普通 的 
程序 中 会 有 大 量 的 拥有 相同 方法 集合 的 对 象 。 如 果 还 傻 傻 的 以 对 锡 为 单位 来 调用 方法 那 就 会 
造成 内 存 的 大 大 的 浪费 。 于 是 一 般 的 方法 是 使 用 类 或 者 multi-method 来 避免 重复 定义 。 


ruby 杀 用 了 传统 上 来 连接 方法 和 对 象 的 结构 ， 类 。 也 就 是 所 有 的 对 象 都 必须 属于 唯一 的 一 个 
类 ， 这 个 对 象 能 够 调用 的 方法 也 友 这 个 类 来 决定 。 这 个 时 候 对 象 通常 被 叫做 “ 某 某 类 的 实例 ”。 


例如 "str" 就 是 类 String 的 实例 。 另 外 ，String 这 个 类 还 定义 了 upcase，downcase，strip 等 一 系 
列 其 他 方法 ， 仿 佛 就 是 在 说 所 有 的 字符 串 对 象 都 可 以 利用 这 些 方法 一 样 。 
# 大 家 都 属于 同一 个 String 类 于 是 拥有 相同 的 方法 。 
"content".upcase() 
"This is a pen.".upcase() 
"chapter II".upcase() 
"content".length() 


"This is a pen.".length() 
"chapter II".length() 


那么 ， 如 果 调 用 的 方法 没有 事前 定义 会 发 生 什 么 呢 ? 在 静态 的 语言 中 ， 编 译 器 会 报错 ， 而 在 
ruby 中 ， 执 行 的 时 候 会 抛 出 例外 。 我 们 来 实际 尝试 一 下 。 这 点 长 度 的 话 直接 在 命令 行 用-e 就 好 
了 。 


% ruby -e "str" ,bad_method() 
-e:1: undefined method ‘bad method' for "str":String (NoMethodError ) 


找 不 到 方法 的 时 候 会 发 生 NomethodError 这 个 错误 。 


另外 最 后 ， 每 次 都 说 一 遍 类 似 “String 的 upcase 方 法 " 太 烦 了 ， 于 是 我 们 下 面 就 
用 “String#upcase” 来 表示 “在 String 的 类 中 定义 好 的 Upcase 方 法 ”。 


顺带 一 提 ， 如 果 写 成 “String.upcase” 在 ruby 中 就 又 是 另 一 个 意思 了 。 
类 的 定义 
到 目前 为 止 都 是 针对 已 经 定义 好 的 类 。 当 然 我 们 也 可 以 自己 来 定义 类 。 定 义 类 的 时 候 使 用 


class 关 键 字 。 


class C 
end 


这 样 就 定义 了 C 这 个 类 。 定 义 好 之 后 可 以 有 以 下 的 使 用 。 


class C 
end 
C = Cnew()  # 生成 类 C 的 实例 带 入 C 中 。 


注意 生成 实例 的 写法 不 是 new C 。 恩 ， 好 像 c.new 这 个 写法 在 调用 方法 一 样 呢 。 如 果 你 这 样 
想 ， 那 说 明 你 很 聪明 。Ruby 生 成 对 象 的 时 候 仅 仅 是 调用 了 方法 而 已 。 


首先 在 Ruby 里 面 类 名 和 常量 名 是 一 个 概念 。 那 么 类 名 和 同名 的 常量 的 内 容 到 底 是 什么 呢 ? 实 
际 上 里 面 是 类 。 在 Ruby 中 一 切 都 是 对 象 ， 那 么 当然 类 也 是 对 象 了 。 我 们 姑且 将 其 称 作 类 对 
象 。 所 有 的 类 对 象 都 是 Class 这 个 类 的 实例 。 

也 就 是 说 class 这 个 写法 ， 完 成 的 是 生成 新 的 类 对 象 的 实例 ， 并 且 将 类 名 带 入 和 它 同名 的 常量 
中 这 一 系列 操作 。 同 时 ， 生 成 实例 ， 实 际 上 是 参照 常量 名 ， 对 该 类 对 象 调用 方法 (通常 是 new 
方法 ) 的 操作 。 看 完 下 面 的 例子 你 就 应 该 会 明白 生成 实例 和 普通 的 调用 方法 根本 就 是 一 回 事 。 


S = "content" 
class C 
end 


S.upcase() # 获取 常量 S 所 指 的 对 象 并 调用 upcase 方 法 。 
Cc.new() # 获取 常量 C 所 指 的 对 象 并 调用 new 方 法 。 


因此 ， 在 Ruby 里 面 hew 并 不 是 保留 词 。 男 外 我 们 也 可 以 用 p 来 显示 刚刚 生成 的 类 的 实例 。 


class C 
end 


c= C.new() 
p(c) # #<C:0x2acbd7e4> 


当然 不 可 能 像 字 符 串 和 整数 那样 漂亮 地 显示 出 来 ， 显 示 出 来 的 是 类 内 部 的 ID。 顺 带 一 提 这 个 
ID 其 实 是 指向 对 象 的 指针 的 值 。 


对 了 。 差 点 忘 了 说 明 一 下 方法 名 的 写法 。 0bject.new 是 类 对 象 Object 调 用 自己 的 方法 new 的 


意思 。 object#new 和 object.new 完全 是 两 码 事 情 ， 必须 严格 区 分 。 


obj = Object.new() # Object.new 
obj.new() # Object#new 


在 刚刚 的 例子 中 因为 还 没 定义 Object#new 方法 所 以 第 二 行 会 报错 。 我 们 就 当 是 一 个 写法 的 例 
子 来 理解 就 好 了 。 


方法 定义 
就 算 定 义 了 类 如 果 不 定义 方法 的 话 一 般 没 有 什么 太 大 意义 。 我 们 继续 定义 类 C 的 方法 。 


class C 
def myupcase( str ) 
return str.upcase() 
end 
end 


定义 类 用 的 是 def。 这 个 例子 中 定义 了 myupcase 这 个 方法 。 这 个 方法 带 一 个 参数 str。 和 变量 


ME 


同样 ， 没 有 必要 写 明 返回 值 的 类 型 和 参数 的 类 型 。 另 外 参数 的 个 数 是 没有 限制 的 。 
self 可 以 取得 这 个 人 


我 们 来 使 用 一 下 定义 好 的 方法 。 方 法 默认 可 以 从 外 部 调用 。 


和 自 6 
= 


# 同样 输出 "CONTENT" 


c= C.new() 
result = c.myupcase("content") 
# 输出 "CONTENT" 
当然 习惯 了 之 后 也 没 必要 每 次 都 带 入 。 下 面 的 写法 也 是 同样 的 效果 。 


p(result) 


p(C.new().myupcase("content")) 


在 执行 方法 的 过 程 中 经 常 要 保存 自己 是 谁 (调用 方法 的 实例 ) 这 个 人 


self 
息 。 在 C++ 或 者 Java 中 就 是 this。 我 们 来 确认 一 下 。 


class C 
def get_self() 
return self 

# #<C:O0X40274e44> 
# #<C:O0X40274e44> 


end 
end 
c= C,new() 

如 上 所 示 ， 两 个 语句 返回 的 是 用 一 个 对 象 。 也 就 是 说 对 实例 c 调 用 方法 的 时 候 slef 就 是 c 自 身 。 


(c) 
p(c.get_self()) 
那么 要 如 何 才 能 对 自身 的 方法 进行 调用 呢 ? 首先 可 以 考虑 通过 self。 
# 调用 自身 的 方法 。 


class C 
def my_p( obj ) 
self.real my_p(obj) 


end 

def real my _p( obj ) 
p(obj) 

end 

end 
C.new().my_p(1)  # 输出 1 

但 是 调用 自身 的 方法 每 次 都 要 这 么 表示 一 下 实在 是 太 麻 烦 。 于 是 可 以 省 略 掉 self， 调 用 自身 的 
方法 的 时 候 直 接 就 可 以 省 略 掉 调用 方法 的 对 象 (receiver)。 


class C 
def my_p( obj ) 
real my_p(obj)  # 无 需 指 定 receiver 
end 
def real my _p( obj ) 
p(obj) 
end 
end 


C.new().my_p(1)  # 输出 1 


实例 变量 
对 象 的 实质 就 是 数据 + 代码 。 这 个 说 法 表明 ， 是 不 够 的 。 我 们 需要 以 对 象 为 
单位 来 保存 数据 。 也 就 是 说 我 们 需要 实例 变量 。 在 C++ 里 面 就 是 成 员 变量 。 


Ruby 的 变量 命名 规则 很 简单 ， 是 由 第 一 个 字符 决定 的 。 实 例 变量 以 @ 开 头 。 


Class C 
def set_i(value) 
@i = value 
end 
def get_i() 
return @i 
end 
end 
c= C.new() 
Cset 1i("ok") 
plesget ji()) A Woky 


实例 变量 和 之 前 的 所 介绍 的 变量 稍微 有 点 区 别 ， 不 用 代入 (也 无 需 定义 ) 也 可 以 可 以 引用 。 这 个 
时 候 会 是 什么 情形 呢 .…... 我 们 在 之 前 代码 的 基础 上 来 试 试看 。 


c= C.new() 
p(c.get_i()) # 显示 nil 


在 没有 set 的 情 ssl 会 显示 nil。nil 是 表示 什么 都 没有 的 对 象 。 明 明 自 身 是 个 对 象 却 表 
示 什 么 都 没有 这 个 的 确 有 点 奇怪 ， 但 是 它 就 是 这 么 一 个 玩意 儿 。 


nil 也 可 以 用 序列 来 表示 。 


p(nil)  # 显示 nil 


初始 化 


目前 为 止 ， OC we 
和 但 是 有 时 候 类 也 需要 特殊 的 初始 化 吧 。 这 个 时 候 我 们 就 不 是 去 改变 new， 而 是 应 该 定义 
initialize 这 个 方法 。 这 样 的 话 ， 在 new 中 就 会 调用 这 个 方法 。 


Class C 
def initialize() 
@i 二 全 
end 
def get_i() 
return @i 
end 
end 
c= C,new() 
p(c.get_i())  # 显示 "Ook" 


严格 意义 上 来 说 这 个 初始 化 只 是 new 这 个 方法 的 特殊 设计 而 不 是 语言 层次 上 的 特殊 设计 。 
继承 


类 可 以 继承 其 他 类 。 比 如 说 String 类 就 是 继承 的 Object 这 个 类 。 在 本 书 中 将 用 下 图 的 箭头 来 表 


Obiect 区 二 煌 一 水: 受 汇 


String 让 学 光 受 芭 


上 图 的 情况 下 ， 被 继承 的 类 (Objectb) 叫 做 父 类 或 者 上 层 类 ， 继 承 的 类 (String) 叫 做 下 层 类 或 者 子 
类 。 注 意 这 个 叫 法 和 C++ 有 所 区 别 。 但 和 Java 是 一 样 的 喊 法 。 


总 之 我 们 来 尝试 一 下 ， 我 们 来 定义 一 个 继承 别 的 类 的 类 。 要 定义 一 个 继承 其 他 类 的 类 的 时 候 
有 以 下 写法 。 


class C < SuperClassName 
end 


到 目前 为 止 ， 我 们 凡是 没有 标明 父 类 的 类 的 定义 ， 其 实 继 承 的 都 是 Object 这 个 父 类 。 


接 下 来 我 们 考虑 一 下 为 什么 要 继承 ， 当 然 继承 是 为 了 继承 方法 了 。 所 谓 继承 ， 仿 佛 就 是 再 次 
重复 了 一 下 在 父 类 中 第 一 的 方法 。 


class C 
def he1l1o() 
return "hello" 
end 
end 


class Sub < C 
end 


sub = Sub.new() 
p(sub.hello( )) # 输出 "hello" 


虽然 hello 方 法 是 在 类 C 中 定义 的 ， 但 是 Sub 这 个 类 的 实例 可 以 调用 这 个 方法 。 当 然 这 次 不 需要 
带 入 变量 。 下 面 的 写法 也 是 同样 的 效果 。 


p(Sub.new( ).hello()) 


只 要 在 子 类 中 定义 相同 名 字 的 方法 就 可 以 重 载 。 在 C++,Object Pascal(Delphi) 使 用 virtual 之 类 
的 保留 字 明 示 除 了 指定 的 方法 之 外 无 法 重 载 ， 而 在 Ruby 中 所 有 的 方法 都 可 以 无 条 件 地 重 载 。 


class C 
def he1l1o() 
return "Hello" 
end 
end 


class Sub < C 
def hello() 
return "Hello from Sub" 
end 
end 


p(Sub.new().hello( )) 示 "Hello from Sub" 
“ "Hello" 


# 显 
p(C.new().hello()) # 显示 


另外 类 可 以 多 层次 继承 。 如 图 4 所 示 。 这 个 时 候 Fixnum 继 承 了 Object 和 Numeric 以 及 Integer 的 
所 有 方法 。 如 果 有 同名 的 方法 则 以 最 近 的 美的 方法 为 优先 。 不 存在 因 关 型 不 同 而 发 生 的 重 堪 
所 以 使 用 条 件 非常 简单 。 


Obiect 
Numeric 数 们 少 纺 又 
IntRger 整数 四 夕 光 又 


Fixnum 小 立 八 整数 帮 夕 屯 又 


另外 C++ 中 可 以 定义 没有 继承 任何 类 的 类 ， 但 是 Ruby 的 类 必然 是 直接 或 者 间接 继承 Object 类 
的 。 也 就 是 说 继承 关系 是 以 Object 在 最 顶端 的 一 棵 树 。 比 如 说 ， 基 本 库 中 的 重要 的 类 的 继承 关 
系 树 如 图 5 所 示 。 


rray 


Exception 
Dir 
Hash File 
Object IO Socket 
odule Class 
Fixnum 
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WE Bignum 
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Regexp 
Thread 


父 类 被 定义 之 后 绝对 不 会 被 改变 ， 
变化 也 不 会 被 删除 。 


变量 的 继承 ...... ? 


Ruby 中 不 继承 变量 (实例 变量 )。 


但 是 只 要 是 继承 了 方法 那么 
就 是 说 会 被 定义 。 这 样 的 话 实例 变 
个 类 的 方法 都 可 以 获取 。 


class A 


def initialize() 
@i 二 Te 
end 
end 


class B<A 
def print_i() 
p(@i) 
end 
end 


B.new().print_i()  # 显示 "Ook" 
如 果 无 法 理解 这 个 行为 那么 干脆 别 
的 父 SS 


接 在 一 起 。( 图 6) 


这 种 强烈 的 丨 实 


因为 就 算 想 
么 调用 继承 的 方法 的 时 候 ( 以 子 类 的 实例 ) 会 发 生 实例 变 


也 就 是 说 在 类 树 中 添加 新 的 类 的 时 候 ， 类 的 位 置 不 会 发 生 


继承 ， 也 无 法 获取 类 中 使 用 的 变量 的 情报 。 


量 的 带 入 。 也 
来 那个 的 命名 空间 在 各 个 实例 中 是 完全 平坦 的 ， 无 论 是 哪 


# 在 new 的 时 候 被 调用 


去 考虑 类 和 继承 。 就 想象 一 下 如 果 类 C 存 在 实例 obj， 那么 C 
当然 也 要 考虑 到 重 载 的 罪责 。 然 后 现在 把 C 的 方法 和 obj 衔 


FE 页 


感 正 是 Ruby 的 面向 对 象 的 特征 。 





模块 


父 类 只 能 指定 一 个 ， 也 就 是 说 Ruby 表 面 上 是 单一 继承 的 。 实 际 上 因为 存在 模块 所 以 Ruby 拥 有 
多 重 继承 的 能 力 。 下 面 我 们 就 来 介绍 一 下 模块 。 


module M 
end 


这 样 就 定义 了 模块 。 在 模块 里 定义 方法 和 类 中 定义 完全 一 样 。 


module M 
def myupcase( str ) 
return str.upcase() 
end 
end 


但 是 因为 模块 无 法 生成 对 象 所 以 是 无 法 直接 调用 模块 里 面 定义 的 方法 的 。 那 么 该 怎么 办 ? 恩 
将 模块 包含 进 其 他 的 类 里 面 就 是 了 。 这 样 的 话 模块 就 仿佛 继承 了 类 一 样 可 以 被 操作 了 。 


module M 
def myupcase( str ) 
return str.upcase() 
end 
end 


class C 
include M 
end 


p(C.new().myupcase("content")) # 显示 "CONTENT" 


虽然 类 C 根 本 没有 定义 任何 方法 但 是 可 以 调用 myupcase 这 个 方法 。 也 就 是 说 它 继承 了 模块 M 
的 方法 。 和 包含 的 机 能 和 继承 完全 是 一 样 的 ， 无 论 是 定义 方法 还 是 获取 实例 变量 都 不 受 限制 。 


模块 无 法 指定 父 类 。 但 是 却 可 以 包含 其 它 模块 。 


module M 
end 


module M2 
include M 
end 


一 样 的 。 但 是 模块 上 边 是 不 会 有 类 的 ， 模 块 可 以 包含 
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下 面 的 例子 包含 了 方法 继承 。 


module OneMore 
def method_ OneMore() 
p("OneMore") 
end 
end 


module M 
include OneMore 


def method_M() 
p("M") 
end 
end 


class C 
Include M 
end 


C.new().method_M() # 输出 "M" 
C.new().method_ OneMore() # 输出 "OneMore" 


Module 也 可 以 和 类 一 样 的 继承 图 。 


OneMore 


M 


T 


C 


话说 类 C 如 果 本 身 已 经 存在 父 类 ， 那 么 这 下 子 和 模块 的 关系 会 变 成 什么 样 呢 ? 请 试 着 考虑 下 面 
的 例子 。 


# modcls.rb 


class Cls 
def test() 
return "class" 
end 
end 


module Mod 
def test() 
return "module" 
end 
end 


class C < Cls 
include Mod 
end 


p(B.new().test()) # "class"? "module"? 


类 C 继 承 了 类 Cls， 并 且 引 入 了 Mod 模 块 。 这 个 时 候 应 该 表示 "class" 呢 还 是 表示 "module" 呢 ? 
换 句 话说， 模块 和 类 哪 一 个 距离 更 近 呢 ?Ruby 的 一 切 都 可 以 向 Ruby 询 问 。 于 是 我 们 来 执行 看 
一 下 结果 。 


% ruby modcls.rb 
"module" 


比 起 父 类 模块 的 优先 度 更 高 呢 ! 


一 般 来 说 ， 在 Ruby 中 引入 模块 的 话 ， 会 在 类 和 父 类 之 间 夹 带 产生 一 个 继承 关系 ， 如 下 图 所 


在 模块 中 又 引入 模块 的 话 会 有 以 下 的 关系 。 


SomeClassD 又 一 八 一 7 了 又 
Module2 
Module1 
SomecClass 
程序 (2) 


注意 ， 在 本 节 中 出 现 的 内 容 非 常 重要 ， 并 且 主 要 讲 的 是 一 些 习 惯 静态 语言 思维 的 人 很 难 习惯 
的 部 分 。 其 他 的 内 容 可 以 一 眼 扫 过 ， 而 这 里 请 格外 注意 。 我 会 比较 详细 地 说 明 。 


常量 的 睹 套 

首先 复习 一 下 常量 。 以 大 写字 母 开 头 的 是 常量 。 可 以 以 如 下 方法 定义 。 
Const = 3 

要 调用 这 个 参数 的 时 候 可 以 如 下 。 


p(Const) # 输出 3 


其 实 写 成 这 样 也 可 以 。 


p(::Const)  # 同样 输出 3 


在 开头 添加 : : 表示 是 在 顶层 定义 的 常量 。 你 可 以 类 比 一 下 文件 系统 的 路 径 的 表示 方法 。 在 
root 目 录 下 有 vmunix 这 个 文件 。 如 果 是 在 "1" 目录 下 的 话 直接 输入 vmunix 就 可 以 获取 文件 。 当 
然 也 可 以 用 完整 的 路 径 "vmunix" 来 表示 。 const 和 ::const 也 是 同样 道理 。 如 果 是 在 顶层 的 
话 直 接 用 const 就 ok， 当 然 使 用 完整 路 径 版 本 的 ::const 也 是 可 以 的 。 


那么 类 比 文件 系统 目录 的 东西 ， 在 Ruby 中 是 什么 呢 ? 那 就 是 类 的 定义 和 模块 的 定义 了 。 因 为 
每 次 都 这 么 说 一 人 遍 的 话 太 烦 了 于 是 下 面 统 一 就 用 类 的 定义 语句 来 代替 。 在 类 的 定义 语句 中 常 
量 的 等 级 会 随 之 上 升 。( 类 比 进 入 文件 系统 的 目录 ) 
class SomeClass 
Const = 3 


end 


p(::SomeClass: :Const) # 输出 3 
p( ”SomeClass::Const)  # 同样 输出 3 


SomeClass 是 在 顶层 层 定 义 的 类 ， 也 是 常量 © 于 是 写成 SomeClass 和 : :SomeClass 都 可 以 9 在 其 
中 签到 的 常量 Const 的 路 径 就 变 成 了 : :SomeClass: :Const 


就 像 在 目录 中 可 以 继续 创建 目录 一 样 ， 在 类 中 也 可 以 继续 定义 类 。 例 如 


class C 0 
class C2 2 
class C3 #2 C3 
end 
end 
end 


那么 问题 是 ， 在 类 定义 语句 中 定义 的 常量 就 必须 要 用 完整 的 路 径 表 示 吗 ? 当然 不 是 了 。 就 像 
文件 系统 一 样 ， 只 要 在 同一 层 的 类 定义 语句 中 ， 就 不 需要 :: 来 获取 。 如 下 所 示 。 


class SomeClass 
Const = 3 
p(Const) # 输出 3 
end 


也 许 你 会 感到 奇怪 。 居 然 在 类 的 定义 语句 中 可 以 直接 书写 执行 语句 。 这 个 也 是 习惯 动态 语言 
的 人 相当 不 习惯 的 部 分 了 。 作 者 当初 也 是 大 吃 一 惊 。 


姑且 再 补充 说 明 一 点 ， 在 方法 中 也 可 以 获取 常量 。 获 取 的 规则 和 在 类 的 定义 语句 中 (方法 之 外 ) 
是 一 样 的 。 


class C 
Const = "ok" 
def test() 
p(Const ) 
end 
end 


C.new().test() # 输出 "ok" 


这 里 从 整体 出 发 来 写 一 段 代码 吧 。Ruby 中 程序 的 大 部 分 都 是 会 被 执行 的 。 常 量 定义 ， 类 定义 
语 多 ， 方 法 定义 语 负 以 及 其 他 几乎 所 有 的 东西 都 会 以 你 看 到 的 顺序 依次 执行 。 


例如 ， 请 看 下 面 的 代码 。 这 段 代码 使 用 了 目前 为 止 说 到 的 很 多 结构 。 


1: p("first") 

2 

3: Cclass C < Object 

4: Const = "in C" 

< 

6: p(Const) 

E: 

8: def myupcase(str) 
9 : return str.upcase() 
10: end 

11: end 

下 2 


13: p(C.new().myupcase("content")) 


这 个 代码 将 会 按照 以 下 的 顺序 执行 。 

1: p("first") 输出 "first" 

3: < Object 通过 常量 Object 获取 Object 类 对 象 。 

3: class C 生成 以 Object 为 父 类 的 新 的 类 对 象 ， 并 将 其 代入 C 
4: Const = "in C" 定义 ::C::Const。 值 为 "in C" 

6: p(Const) 输出 ::C::Const 的 值 。 输 出 结果 为 "in C"。 

8: def myupcase(...)...end 定义 方法 C#myupcase。 

13: C.new().myupcase(...) 通过 常量 C 调 用 其 new 方 法 ， 并 且 调 用 其 结果 的 myupcase 方 法 。 
9: return str.upcase() 返回 "CONTENT"”。 

13: p(.…) 输出 "CONTENT" 。 

局 部 常量 的 作用 域 

终于 说 道 了 局 部 变量 的 作用 域 。 


顶层 ， 类 定义 语句 内 部 ， 模 块 定义 语句 内 部 ， 方 法 自身 都 各 自 拥有 完全 独立 的 局 部 变量 作用 
域 。 也 就 是 说 在 下 面 的 程序 中 lvar 这 个 变量 都 不 一 样 ， 也 没有 相互 往来 。 


lvar = 'toplevel' 
class C 
lvar = 'in C! 
def method() 
lvar = 'in C#method' 
end 
end 


p(lvar) # 输出 "toplevel" 
module M 

lvar = 'in M' 
end 


p(lvar) # 输出 "toplevel" 


表示 上 下 文 的 self 


以 前 执行 方法 的 时 候 自 己 自身 (调用 方法 的 对 象 ) 会 成 为 self。 虽 然 这 个 是 正确 的 说 法 ， 但 是 话 
2 人 实际 上 不 管 是 在 Ruby 程 序 执行 到 哪里 ，Self 总 会 被 具体 赋值 。 也 就 是 说 在 顶层 和 
在 类 定义 语句 中 都 会 有 self 存 在 。 


顶层 是 存在 self 的 ， 顶 层 的 self 就 是 main。 没 有 什么 奇怪 的 规则 ，main 就 是 Object 的 实例 。 其 
实 main 也 仅仅 是 为 了 self 而 存在 的 ， 并 没有 什么 深入 的 含义 。 


也 就 是 说 顶层 的 self 是 main，main 则 是 Object 的 实例 ， 从 顶层 也 可 以 直接 调用 Object 的 方法 。 
另外 在 Object 中 引入 了 Kernel 这 个 模块 ， 里面 存在 着 诸如 p 和 puts 一 样 泡 数 风格 的 方法 。 于 
是 在 顶层 也 可 以 调用 p 和 puts 。 





Kernel p, puts, printf, gets, , ,.., 







hyFLUANNL 
self = main 


当然 p 本 来 就 不 是 函数 而 是 方法 。 只 是 因为 其 定义 在 Kernel 中 ， 无 论 在 哪里 ， 换 名 话说 无 论 
self 的 类 是 什么 ， 都 可 以 被 当 作 "自己 的 "方法 来 像 函 数 一 样 被 调用 。 所 以 Ruby 在 丨 正 意义 上 不 
存在 函数 。 存 在 的 只 有 方法 。 


顺带 一 提 ， 出 了 p 和 puts 之 外 ， 带 有 函数 风格 的 方法 还 


有 print puts printf sprintf gets forks exec 等 等 等 等 。 大 多 数 都 是 仿佛 曾经 在 哪里 见 过 的 
名 字 。 从 这 个 命名 中 大 概 也 可 以 想象 得 出 Ruby 的 性 格 了 吧 。 


接 下 来 ， 既 然 self 在 那里 都 会 被 设 定 那么 在 类 的 定义 语句 里 面 也 是 一 样 的 。 在 类 的 定义 中 self 
就 是 类 自身 (类 对 象 )。 于 是 就 会 变 成 这 样 。 


class C 
p(self) # C 
end 


这 样 设计 有 什么 好 处 ?实际 上 有 个 使 其 好 处 突出 得 十 分 明显 的 例子 。 请 看 。 


module M 

end 

class C 
Include M 

end 


实际 上 这 个 include 是 针对 类 对 象 C 的 调用 。 虽 然 我 们 还 没有 提 及 ， 但 是 很 明显 Ruby 可 以 省 略 
调用 方法 的 括号 。 由 于 到 目前 还 没有 结束 类 定义 语句 的 内 容 ， 所 以 作者 为 了 尽量 使 其 看 起 来 
不 像 方 法 的 调用 ， 而 把 括号 给 去 掉 了 。 


载 入 
Ruby 中 载 入 库 的 过 程 也 是 在 执行 中 进行 。 通 常 这 样 写 。 


require("library_name") 


为 了 不 被 看 到 的 假象 所 欺骗 这 里 再 说 一 如，require 其 实 是 方法 ， 甚 至 都 不 是 保留 语句 。 这 样 

写 的 话 在 写 的 地 方 被 执行 ， 库 里 面 的 代码 得 以 被 执行 。 因 为 Ruby 中 不 存在 像 Java 里 面 的 包 的 
概念 ， 如 果 想 要 将 库 的 命名 空间 分 开 来 的 话 ， 可 以 建立 一 个 文件 夹 然后 将 库 放 到 文件 夹 里 
春天 


require("somelib/file1") 
require("somelib/file2") 


于 是 在 库 中 也 可 以 定义 普通 的 类 和 模块 。 顶 层 的 常量 作用 域 和 文件 并 没有 多 大 关联 ， 而 是 平 
坦 的 ， 于 是 从 一 开始 就 可 以 获取 在 其 他 文件 中 定义 的 类 。 如 果 想 要 用 命名 空间 来 区 分 类 的 名 
字 ， 可 以 用 下 面 的 方法 来 显 式 嵌入 模块 。 


# net 库 的 例子 来 使 用 模块 命名 空间 来 区 分 类 
module Net 
class SMTP 
a 
end 
class POP 
A 
end 
class HTTP 
He 
end 
end 


就 类 的 话题 继续 深入 


还 是 关于 常量 
到 目前 为 止 用 文件 系统 的 例子 来 类 比 了 常量 的 作用 域 。 现 在 请 忘掉 刚才 的 例子 
常量 里 面 还 有 各 种 各 样 的 陷阱 。 首 先 ， 我 们 可 以 获取 "外 层 " 类 的 常量 。 


Const = "ok" class C p(Const)# 输出 "ok" end 


为 什么 要 这 样 ? 因为 可 以 方便 使 用 命名 空间 来 调用 模块 。 到 底 怎 么 回 事 ? 我们 来 用 之 前 Net 库 
的 类 来 做 进一步 说 明 。 
module Net 
class SMTP 
# 在 方法 中 可 以 使 用 Net::SMTPHelper 
end 
class SMTPHelper  # 辅助 Net::SMTP 的 类 
end 
end 


在 这 种 场合 ， 在 SMTP 类 中 只 需要 写 上 Net::SMTPHelper 就 可 以 进行 调用 。 于 是 就 有 了 "外 层 类 
如 果 可 以 调用 的 话 就 很 方便 了 "这 个 结论 。 

不 管 外 层 的 类 进行 了 多 少 层 谋 套 都 可 以 调用 。 在 不 同 的 姐 套 层次 中 如 果 定 义 了 同名 的 常量 ， 
a 


Const = "far" 
class C 
Const = "near" # 这 里 的 Const 比 最 外 层 的 Const 更 近 一 些 
class C2 
class C3 
p(Const) # 输出 "near" 
end 
end 
end 


真是 太 特 么 复杂 了 。 


我 们 来 总 结 一 下 吧 。 在 探索 常量 的 时 候 ， 首 先 探索 的 是 外 层 的 类 ， 然 后 探索 父 类 。 例 如 看 下 
面 这 个 故意 写成 这 么 扭曲 的 例子 


class A1 
end 
Class A2 < A1 
end 
class A3 < A2 
class B1 
end 
class B2 < Bi1 
end 
class B3 < B2 
class C1 
end 
class C2 < C1 
end 
class C3 < C2 
p(Const) 
end 
end 
end 


在 C3 内 部 想 要 获取 Const 的 话 ， 会 按照 下 图 的 顺序 进行 探索 。 


Object 一 An 
4 3 2 


注意 一 点 ， 外 层 的 类 的 父 类 ， 例 如 A1 和 B2 是 不 会 被 探索 的 。 探 索 的 时 候 所 谓 的 外 层 仅 仅 是 向 
外 层 ， 父 类 的 话 也 仅仅 是 朝 着 父 类 的 方向 。 如 果 不 这 样 的 话 ， 会 造成 探索 的 类 过 多 ， 而 无 法 
正确 预测 这 个 复杂 的 行为 。 

meta 类 


我 们 说 过 对 象 可 以 调用 方法 。 调 用 的 方法 则 是 对 象 的 类 所 决定 的 。 那 么 类 对 象 也 一 定 存在 自 
己 所 属 的 类 。 


“String ”一 一 String 一 一 一 2277 
这 个 时 候 直接 和 Ruby 确 认 是 最 好 的 方法 。 返 回 自己 所 属 的 类 的 方法 是 object#class 。 


p("string" .class())  # 输出 String 
p(String.class()) # 输出 Class 
p(Object.class()) # 输出 Class 


String 貌 似 属 术语 Class 这 个 类 的 。 那 么 进一步 Class 所 属 的 类 是 什么 呢 ? 


p(Class.class()) # 输出 Class 


又 是 Class。 也 就 是 说 不 管 是 什么 对 象 ， 沿 着 .Class().class().class().... 总 会 到 达 Class， 然 
后 陷入 循环 以 臻 最 后 。 


String ”一 一 > String 一 Class 一 一 ”Class … 


1 一 ”三 iIXmUmT 一 一 ”Class 一 -CIaSS '… 


Class 是 类 的 类 。 我 们 称 拥 有 "XX 的 xx" 的 这 种 递归 构造 的 的 东西 "meta xx"。 所 以 Class 也 被 叫 
做 "meta class( 类 )"。 

meta 对 象 

接 下 来 我 们 改变 目标 ， 来 考察 一 下 模块 。 模 块 也 是 对 象 ， 当 然 会 有 其 所 属 的 类 了 。 我 们 来 调 


查 一 下 。 


module M 
end 
p(M.class()) # 输出 Module 


模块 对 象 的 类 貌似 是 Module。 那 么 Module 类 对 象 类 是 什么 呢 ? 
p(Module,.class()) # Class 


答案 又 是 Class。 


接 下 来 还 个 方向 继续 调查 其 中 的 继承 关系 。Class 和 Module 的 父 类 到 底 是 什么 ?Ruby 中 可 以 
通过 Class#superclass 来 进行 查看 。 


p(Class.superclass()) # Module 
p(Module. superclass()) # Object 
p(Object. superclass()) # Nil 


Class 居 然 是 Module 下 层 的 类 。 根 据 以 上 事实 可 以 得 到 Ruby 中 重要 类 的 关系 图 。 





到 目前 为 止 我 们 没有 做 任何 说 明 就 是 用 了 new 和 include 这 些 东 西 。 现 在 终于 可 以 解释 清楚 他 
们 的 申 实 面 狐 了 。new 实 际 上 是 Class 类 定义 的 方法 。 所 以 无 论 是 什么 类 (因为 都 是 Class 类 的 
实例 ) 都 可 以 使 用 new。 但 是 Module 里 面 没 有 定义 new 所 以 无 法 生成 实例 。 同 样 ，include 被 定 


义 在 Module 类 中 ， 所 以 不 管 是 是 模块 都 可 以 调用 include 。 


奇异 方法 


对 象 可 以 调用 方法 ， 能 调用 的 方法 由 对 象 所 属 的 类 来 决定 ， 到 目前 为 止 我 们 都 这 么 说 。 但 是 
作为 设计 理念 我 们 还 是 希望 方法 都 是 属于 对 象 的 。 说 到 底 只 是 因为 同样 的 类 定义 同样 的 方法 
可 以 省 去 不 少 麻烦 。 


于 是 实际 上 在 Ruby 中 是 存在 不 通过 类 而 直接 给 对 象 定 义 的 方法 的 机 制 的 。 可 以 这 样 写 。 


obj = Object.new() 
def obj.my_first() 
puts("My first singleton method") 
end 
obj.my_first() # My first singleton method 


正如 你 已 了 解 和 到 ，Object 是 所 有 类 的 根 目 录 。 这 人 么 重要 的 类 里 面 是 不 会 轻 多 让 你 定义 my _first 

这 种 奇怪 名 字 的 方法 的 。 另 外 obj 是 Object 的 实例 。 但 是 却 可 以 通 、 1 ss 
my_first 这 个 方法 。 也 就 是 说 ， 我 们 定义 了 和 所 属 类 完全 无 关 的 方法 。 这 种 给 对 象 定义 的 方法 
我 们 称 为 奇异 方法 (singleton method) 。 


么 什么 时 候 使 用 奇异 方法 呢 ? 首先 是 像 Java 和 C++ 一 样 定义 静态 方法 的 时 候 。 也 就 是 说 不 
需要 生成 实例 就 可 以 使 用 的 方法 。 这 种 方法 在 Ruby 里 面 作为 Class 类 对 象 的 奇异 方法 而 存在 。 


例如 UNIX 中 存在 unlink 这 种 系统 调用 来 删除 文件 的 别名 。Ruby 中 这 个 方法 作为 File 类 的 奇异 
方法 可 以 直接 被 使 用 。 我 们 来 试 一 试 。 


File.unlink("core") # 消去 core 名 称 的 dump。 


每 次 提 到 都 说 一 遍 " 这 个 是 File 对 萌 的 奇异 方法 unlink" 实 在 是 太 麻 烦 了 ， 下 面 用 "File.unlink" 代 
替 。 注 意 不 要 写成 "File#unlink" 或 者 是 将 "在 File 类 中 定义 的 方法 write" 错 写成 "File.write" 。 


下 面 是 写法 的 总 结 


写法 调用 的 对 象 调用 的 实例 
File.unlink File 类 自身 File.unlink("core") 
File#write File 的 实例 f.write("str") 
类 变量 


类 变量 是 Ruby1.6 新 增 的 内 容 。 类 变量 和 变量 属于 同一 个 类 ， 可 以 被 类 以 及 类 的 实例 代入 ， 引 


用 。 来 看 一 下 例子 。 开 头 二 是 类 变 


class C 


QQcvar = "ok" 

p(@Qcvar ) # 输出 "ok" 

def print_cvar() 
p(@Qcvar ) 

end 


end 


C.new().print_cvar() # 输出 "ok" 


类 变量 也 是 由 最 初 的 定义 来 赋值 代入 的 ， 所 以 在 代入 之 前 引用 出 错 。 念 佛 多 加 了 个 "@" 就 和 一 
般 的 实例 变量 不 一 样 了 。 


% ruby -e ' 
class C 

QQcvar 
end 


-e:3:; uninitialized class variable @@cvar in C (NameError ) 


在 这 里 直接 用 "-e" 命 令 执行 了 程序 。"" 之 间 三 行 是 程序 正文 。 


另外 类 变量 是 可 以 继承 的 。 换 钨 话说， 子 类 可 以 代入 ， 引 用 父 类 的 类 变量 。 


class A 
@Qcvar = "ok" 
end 


class B < A 
p(@Qcvar ) # "Ok" 
def print_cvar() 
p(@Qcvar ) 
end 
end 


B.new().print_cvar() # "Ok" 


全 局 变量 
最 后 姑且 说 一 名 ， 全 局 变量 也 是 存在 的 。 无 论 在 程序 的 哪里 都 可 以 代入 ， 引 用 。 在 变量 前 加 
上 "$" 就 成 了 全 局 变量 。 


$gvar = "global variable" 
p($gvar) # "global variable" 


全 局 变量 和 实例 变量 一 样 ， 我 们 可 以 看 作 所 有 的 名 称 都 是 在 代入 之 前 就 被 定义 好 的 。 所 以 就 
算是 代入 前 我 们 引用 这 个 变量 ， 只 会 返回 nil 而 不 会 发 生 错 误 。 


第 二 章 对 外 
对 象 


点 睛 
本 章 开始 我 们 终于 要 开始 探索 ruby 的 源码 了 。 首 先 按照 预告 我 们 先 从 对 象 的 构造 开始 。 


接 下 来 我 们 来 考虑 一 下 对 象 作为 对 象 而 成 立 的 必要 条 件 吧 。 之 前 已 经 说 明 过 几 次 对 象 到 底 是 
什么 ， 其 实 作 为 对 象 不 可 缺少 的 条 件 有 三 个 ， 分 别 是 


。 可 以 区 别 自 己 和 外 界 。( 拥 有 识别 标志 ) 
。 能 够 对 外 界 的 行动 作出 反应 。( 方 法 ) 
。 拥有 内 部 状态 。( 实 例 变量 ) 


本 章 会 对 这 三 个 特征 顺序 确认 。 


主要 注目 的 文件 是 ruby.h， 其 他 诸如 object.c, class.c, variable.c 也 会 稍微 关注 。 


Value 和 对 象 的 结构 体 


ruby 中 对 象 的 实体 是 由 结构 体 来 表现 的 。 各 种 处 理 经 常 要 和 指针 打交道 。 结构 体 根据 不 同 的 
类 会 使 用 不 同 的 类 型 ， 但 是 指针 无 论 是 在 哪个 结构 体 中 都 是 VALUE 类 型 。 


VALUE 
构造 体 
VALUE 的 定义 如 下 。 


71 typedef unsigned long VALUE; 
(ruby.h) 


VALUE 实 际 上 被 用 来 强制 转换 成 各 种 对 象 结 构 体 的 指针 。 所 以 当 指 针 的 长 度 和 unsigned long 
不 一 致 的 时 候 ruby 就 无 法 正常 工作 。 严 格 意义 上 来 说 ， 如 果 存 在 比 sizeof(unsigned long) 更 长 
的 指针 类 型 ruby 会 无 法 正常 工作 。 当 然 最 近 的 系统 基本 上 都 符合 上 述 要 求 ， 过 去 不 符合 这 种 
要 求 的 机 器 还 是 很 多 的 。 


至 于 结构 体 ， 也 是 有 很 多 种 类 。 主 要 是 按照 对 象 的 类 来 进行 区 别 。 
struct RObject 凡是 不 符合 以 下 条 件 的 
struct RClass Class 对 象 


struct RFloat 小 数 


struct RString 字符 串 
struct RArray 数组 
struct RRegexp 正则 表达 式 


struct RHash 哈 希 表 


struct RFile ID、File、Socket 之 类 


struct RData 上 述 以 外 所 有 用 C 语 言 


struct RStruct Ruby 的 结构 体 Struct 类 


struct RBignum 大 整数 


我 们 来 看 几 个 对 象 结构 体 的 定义 的 例子 


/* 用 作 一 般 对 象 的 结构 体 */ 
295 struct RObject { 


296 struct RBasic basic,; 
297 struct st_ table *iv_tbl; 
298 }; 


/* 字符 串 的 结构 体 (String 实 例 ) 


314 Struct RString { 


315 struct RBasic basic; 
316 long len; 

317 char *ptr; 

318 union { 

319 long capa; 

320 VALUE shared; 
321 } aux; 

322 }; 


/* 数组 (Array 四 实例 ) 的 结构 体 */ 


324 Struct RArray { 


325 struct RBasic basic; 
326 long len; 

327 union { 

328 long capa; 

329 VALUE shared; 
330 } aux; 

331 VALUE *ptr; 

332 }; 

(ruby.h) 


我 们 先 把 逐个 详细 的 说 明 放 到 后 


面 ， 首 先 从 整体 层面 上 来 说 。 


首先 VALUE 被 定义 成 unsigned long 类 型 ， 要 作为 指针 使 用 就 必须 进行 


于 是 各 个 对 象 的 构造 函数 就 配 有 Rxxxx() 这 
RSTING(),struct RArray 的 宏 是 RARRAY()。 


VALUE str = 5 
VALUE arr = 


种 形式 的 宏 。 上 比如 struct RString 的 宏 就 是 
这 些 宏 的 用 法 如 下 。 


RSTRING(str) ->len; /* ((struct RString*)str)->len */ 
RARRAY (arr)->len; /* ((struct RArray*)arr)->len */ 


接 下 来 我 们 看 到 所 有 的 对 象 结构 体 的 开头 都 会 有 一 个 struct RBasic 类 型 的 成 员 basic 存 在 。 结 
果 就 是 无 论 VALUE 是 指向 何 种 对 象 的 结构 体 的 指针 ， 只 要 被 强制 转换 成 struct RBasic*， 就 可 
以 访问 basic 的 内 容 。 


struct RBasic struct RObject struct RString struct RArray 


struct RBasic 


struct RBasic 





struct RBasic struct RBasic 





既然 这 么 费劲 心思 作出 这 种 设计 ，struct RBasic 一 定 存放 着 Ruby 对 象 的 重要 信息 。 我 们 来 看 
struct RBasic 的 定义 。 


290 struct RBasic { 

291 unsigned long flags; 
292 VALUE klass; 

293 }; 


(ruby.h) 


flags 是 拥有 多 种 目的 的 标志 ， 最 重要 的 用 途 就 是 保存 结构 体 的 类 型 (struct RObject 之 类 )。 表 
示 类 型 的 标志 用 T_xxxx 来 定义 。 可 以 从 VALUE 通 过 宏 TYPE() 访 问 。 比 如 下 面 的 例子 


VALUE str; 
str = rb_str_new(); /* 生成 ruby 的 字符 囊 ( 对 应 结构 体 为 RSting) */ 
TYPE( str) /* 返回 值 为 T_STRING */ 


这 些 标 志 都 是 T_xxxx 的 形式 ，struct RString 的 话 就 是 T STRING，struct RArray 的 话 就 是 
T_ARRAY， 对 应 方式 十 分 规则 。 


struct RBasic 的 另 一 个 成 员 klass 保 存 的 是 对 象 所 属 的 类 。Kklass 的 类 型 是 VALUE， 足 以 说 明 其 
保存 的 是 Ruby 的 对 象 (其 实 是 对 象 的 指针 )。 也 就 是 说 这 个 就 是 class 类 的 对 象 了 。 


VALUE struct RString struct RCIlass 












basic.klass 






ptr 


对 象 和 类 的 关系 在 本 章 “ 方 法 "这 一 小 节 中 会 详细 说 明 。 


顺带 一 提成 员 名 用 klass 代 替 class 是 为 了 防止 用 C++ 的 编译 器 编译 时 和 保留 词 class 发 生 冲 突 。 


关于 结构 体 的 类 型 


我 们 说 过 struct Basic 的 成 员 flags 保 存 了 结构 体 的 类 型 。 可 是 为 什么 必须 保存 结构 体 的 类 型 
呢 ? 这 是 因为 所 有 类 型 的 结构 体 都 是 通过 VALUE 来 处 理 的 。 当 指向 结构 体 的 指针 被 转换 成 
VALUE 之 后 变量 中 已 经 不 存在 类 型 的 信息 ， 编 译 器 也 是 不 会 特殊 照顾 的 。 于 是 我 们 只 有 自己 
管理 好 各 自 的 类 型 了 。 这 个 也 是 针对 所 有 结构 体 类 型 统一 管理 的 一 大 缺陷 。 


那么 ， 了 既然 使 用 的 结构 体 是 由 类 决定 的 ， 那 么 为 什么 还 要 把 结构 体 和 类 分 开 保存 呢 ? 直接 从 
类 中 访问 结构 体 的 类 型 不 就 好 了 吗 ? 不 这 样 做 有 两 个 理由 。 


第 一 ， 抱 菊 我 们 要 推翻 刚才 说 过 的 话 。 实 际 上 存在 着 不 具有 struct RBasic 的 结构 体 ( 即 不 存在 
klass 成 员 )。 比 如 说 将 在 第 二 部 分 登场 的 struct RNode。 但 是 这 种 特殊 的 结构 体 开头 还 是 会 有 
一 个 flags 类 型 的 成 员 。 所 以 所 有 结构 体 只 需要 拥有 flags 就 可 以 进行 统一 管理 。 


第 二 ， 其 实 类 和 结构 体 不 是 一 一 对 应 的 。 上 比如 说 用 户 用 Ruby 语 言 定义 的 类 的 实例 全 部 是 使 用 
struct RObject 来 保存 。 如 果 要 从 类 中 访问 结构 体 的 类 型 就 必须 记录 下 所 有 类 和 结构 体 的 对 应 
关系 。 那 还 不 如 直接 将 类 的 信息 放 入 结构 体 中 来 的 快捷 便利 。 


basic.flags 的 用 途 


谈 到 basic.flags 的 用 途 ， 刚 才 一 直 说 是 保存 结构 体 类 型 ， 这 种 说 法 有 点 恶心 我 们 还 是 用 图 来 进 
行 一 下 说 明 。 此 图 仅仅 是 为 了 在 之 后 遇 到 疑惑 的 时 候 可 以 方便 参考 ， 现 在 还 不 必 全 部 理解 。 


仅仅 是 看 图 的 话 我 们 会 发 现 32 比 特 中 还 有 21 比 特 的 空余 。 其 实 那些 部 分 被 定义 为 
FL_USER0O~FL_USER8 这 一 系列 的 标志 ， 根 据 结构 体 不 同 使 用 目的 也 不 相同 。 上 图 为 了 做 示 
范 把 FL_USER0 也 放 了 进去 。 


VALUE 的 填充 对 象 


我 们 说 过 a long。 因 为 VALUE 仅 仅 是 指针 ， 貌 似 void* 也 能 胜任 ， 实 
际 上 不 这 样 做 是 有 理由 的 。 因 为 VALUE 也 有 不 是 指针 的 时 候 。 非 指针 的 VALUE 存在 以 下 六 种 
情况 。 

e 数值 较 小 的 整数 

。 符号 (Symbol) 

e true 

。 false 

e nil 

e。 Qundef 


我 们 按 顺序 来 说 。 


数值 较 小 的 整数 


Ruby 中 一 切 都 是 对 象 所 以 整数 也 是 对 象 。 但 是 整数 的 实例 是 在 是 太 多 了 ， 如 果 每 个 整数 都 用 
一 个 结构 体 来 表示 的 话 那 运行 速度 就 太 慢 了 。 假 如 要 递 加 从 0 到 50000 的 整数 ， 仅 仅 如 此 就 要 
生成 50000 个 对 象 的 话 会 让 人 一 瞬间 陷入 犹 称 。 


那么 我 们 来 实际 看 一 下 C 中 奖 int 类 型 变换 成 Fixnum 的 宏 INT2FIX 吧 ， 我 们 来 确认 一 下 Fixnum 
的 确 是 被 填 埋 到 了 VALUE 里 面 。 


123 #define INT2FIX(i) ((VALUE)(((long)(i))<<1 | FIXNUM_FLAG)) 
122 #define FIXNUM_FLAG QOxO1 


(ruby.h) 


左 移 一 位 之 后 和 1 相 或 。 


110100001000 变换 前 
1101000010001 变换 后 


就 是 如 此 ， 保 证 了 保存 Fixnum 的 VALUE 总 是 奇数 。 另 一 方面 ，Ruby 对 象 结构 体内 存 空间 的 申 
请 使 用 的 是 malloc()。 一 般 总 是 会 被 分 配 到 4 的 倍数 的 地 址 。 所 以 地 址 的 值 和 保存 Fixnum 的 
VALUE 值 的 范围 是 不 会 重 司 的 。 


另外 ， 将 int 和 long 变 换 成 VALUE 还 有 其 他 一 些 安 ， 比 如 INT2NUM()IONG2NUM() 。 它 们 都 是 
以 “00200” 的 形式 ，NUM 的 话 可 以 同时 处 理 Fixnum 和 Bignum。 比如 INT2NUM() 会 把 超过 
Fixnum 范 围 的 数 转换 成 Bignum 。NUM2INT() 会 把 Fixnum 和 Bignum 都 转换 成 int 类 型 。 如 果 超 
出 int 的 范围 会 发 生 例外 ， 没 有 必要 在 这 里 进行 越界 检测 。 


符号 (symbol) 

符号 是 什么 ? 

这 个 问题 比较 麻烦 ， 我 们 先 来 说 为 什么 需要 符号 。 首 先 我 们 知道 [uby 内 部 存在 着 ID 类 型 的 变 
量 。 


72 typedef unsigned long ID; 
(ruby.h) 


这 个 ID 是 和 任意 的 字符 串 一 一 对 应 的 整数 。 虽 然 话 这 么 说 ， 但 是 也 不 可 能 和 这 个 世界 上 所 有 
的 字符 串 都 一 一 对 应 吧 ? 这 种 对 应 关系 仅仅 是 存在 于 "ruby 的 进程 之 中 "。 关 于 ID 的 访问 方法 我 
们 在 下 一 章 " 名 称 和 命名 表 " 中 讲述 。 


语言 处 理 的 程序 需要 处 理 大量 的 名 字 。 变 量 名 ， 常 量 名 ， 类 名 ， 文 件 名 等 等 。 这 些 大 量 的 名 
字 如 果 用 char* 来 保存 处 理 实在 是 太 不 容易 了 。 如 果 你 硬 要 问 是 哪里 不 容易 ， 我 可 以 告诉 你 那 
就 是 除了 内 存 管理 还 是 内 存 管理 。 另 外 名 字 的 比较 也 经 常会 发 生 ， 如 果 每 次 都 比较 字符 串 是 
否 相符 的 话 实 在 是 效率 太 低 。 于 是 我 们 不 直接 处 理 字 符 串 ， 而 是 将 其 对 应 到 别 的 东西 上 面 来 
处 理 。 而 那 “ 别 的 东西 "就 是 整数 了 。 因 为 整数 的 处 理 是 最 简单 的 。 


将 ID 带 入 到 ruby 的 世界 中 的 正 是 符号 。ruby1.4 之 前 直接 将 ID 的 值 转换 成 Fixnum 作 为 符号 使 
用 。 现 在 也 可 以 通过 Symbol#to i 来 访问 它 的 值 。 然 而 在 实际 运用 中 逐渐 发 现 把 符号 当 作 
Fixnum 处 理 实在 不 太 受 当 ， 于 是 在 ruby1.6 之 后 就 有 了 独立 的 符号 类 Symbol 了 。 

符号 对 象 由 于 经 常 作为 哈 希 表 的 键 使 用 所 以 数量 非常 多 。 于 是 Symbol 就 和 Fixnum 一 样 被 填 理 
进 了 VALUE 里 面 。 我 们 来 看 一 下 将 ID 转换 成 Symbol 的 宏 ID2SYM()。 


158 #define SYMBOL_FLAG 0xge 
160 #define ID2SYM(x) ((VALUE)(((long)(x))<<8|SYMBOL_FLAG)) 


(ruby.h) 


左 移 8bit 就 相当 于 乘 上 256， 也 就 是 4 的 倍数 。 然 后 和 0x0e 相 或 (这 个 时 候 和 加 法 没 区 别 )， 这 样 
的 话 最 终结 果 也 不 会 是 4 的 倍数 。 当 然 也 不 会 是 奇数 ， 也 就 是 说 不 会 和 其 他 的 VALUE 类 型 相 重 
司 。 昌 是 巧妙 的 方法 。 


最 后 我 们 来 看 一 下 ID2SYM() 的 逆 变 化 SYM2ID()。 


161 #define SYM2ID(x) RSHIFT( (long)x,8) 
(ruby.h) 


RSHIFT 是 右 移 。 右 移 根 据 平台 不 同 会 出 现 整 数 的 符号 剩余 ， 不 剩余 的 区 别 ， 所 以 保险 起 见 我 
们 用 宏 来 代替 。 


true false nil 


这 三 个 是 Ruby 里 面 特殊 的 对 象 。 分 别 是 代表 逻辑 站 ， 公 辑 假 ， 和 没有 对 象 的 对 和 象 。 这 三 者 的 C 
语言 中 的 值 定义 如 下 。 


164 #define Qfalse 0 /* RubyDfalse */ 
165 #define Qtrue 2 /* RubyDtrue */ 
166 #define Qnil 4 /* RubyODnil */ 
(ruby.h) 


这 次 竟然 是 偶数 了 。 但 是 要 注意 0 和 2 作为 指针 使 用 是 不 可 能 的 。 所 以 不 必 担 心 和 其 他 的 
VALUE 和 值 重复 。 因 为 虚拟 内 存 空 间 第 一 块 地 址 通常 不 会 被 分 配 。 同 时 也 是 为 了 当 想 要 访问 
NULL 指 针 的 时 候 程序 能 够 迅速 得 出 错 。 


另外 Qfalse 因 为 值 为 0 所 以 才 c 语 言 层次 也 是 被 当 作 逻辑 假 来 使 用 的 。 实 际 上 在 ruby 的 返回 逻辑 
里 假 值 的 函数 中 ， 返 回 值 会 被 转换 成 VALUE 或 者 init 然 后 返回 Qtrue/Qfalse。 这 种 做 法 很 常 


0° 


汉 六 


至 于 Qnil， 有 专门 针对 VALUE 判断 其 是 否 为 Qnil 的 宏 。NIL_P() 


170 #define NIL_P(V) ((VALUE)(v) == Qnil) 


(ruby.h) 
~p 这 种 命名 方式 术语 lisp 风 格 。 其 表示 进行 的 处 理 是 返回 丨 值 的 行为 。 也 就 是 说 NIL _P 其 意 
思 " 为 参数 是 否 为 nil?"p 来 自 于 predicate。( 断 言 /谓语 )。 这 种 命名 规则 在 ruby 中 被 广泛 使 用 。 


另外 ruby 中 除了 false 和 nil 是 假 其 他 都 是 捧 。 但 是 c 中 的 话 nil(Qnil) 也 是 揽 。 于 是 用 Cc 语 言 判 定 
Ruby 表 达 式 丨 假 的 宏 RTEST() 应 该 如 下 。 


169 #define RTEST(v) (((VALUE)(v) & ~Qnil) != 9) 


(ruby.h) 


Qnil 只 有 第 三 位 的 比特 是 1,~P 取 反之 后 只 有 第 三 位 是 0。 与 其 bit 和 之 后 结果 是 真 的 只 有 Qfalse 
和 Qnil 。 


加 上 !=0 是 为 了 确保 结果 是 0 或 者 1。 因 为 glib 这 个 库 要 求 申 值 只 能 是 0 或 者 1。 ([ruby- 
dev:11049] ) 


说 来 Qnil 的 Q 是 什么 玩意 儿 ? 是 民 的 话 还 可 以 理解 ， 为 什么 是 Q 呢 ?向 人 询问 的 结果 是 因为 
emacs 中 是 这 样 的 。 所 。 


Qundef 


167 #define Qundef 6 /* undefined value for placeholder */ 


(ruby.h) 
这 个 值 在 解释 器 内 部 作为 “未 定义 值 "来 使 用 。 在 Ruby 中 是 不 会 出 现 的 。 
方法 
Ruy oe 性 质 要 数 拥有 自我 身份 ， 能 够 调用 方法 ， 以 及 按照 实例 存 有 数据 这 三 个 方 
面 了 。 这 个 小 节 我 们 来 讲 第 二 点 ， 对 象 和 方法 结合 的 方式 。 


struct RClass 


在 ruby 中 类 也 是 作为 对 象 存 在 的 。 那 当然 类 的 对 象 的 实体 也 需要 一 个 结构 体 。 这 个 结构 体 就 
是 struct RClass 了 。 这 个 结构 体 类 型 的 flag 为 T_CLASS。 


另外 类 和 模块 基本 属于 同一 概念 所 以 没有 必要 区 分 各 自 的 实体 。 于 是 模块 的 结构 体 也 是 用 
struct RCIlass 来 表现 的 。 模 块 的 结构 体 flag 被 设置 成 T _ MODULE 来 进行 区 别 。 


300 struct RClass { 


301 struct RBasic basic; 

302 struct st_ table *iv_ tbl; 
303 struct st_ table *m tbl; 
304 VALUE Super ， 

305 }; 

(ruby.h) 


首先 注意 到 m_tbl(Method Table) 这 个 成 员 。struct st_table 是 ruby 中 到 处 可 见 的 哈 希 表 。 详 细 
会 在 下 一 章 “ 名 称 与 命名 表 ” 中 说 明 ， 总 之 就 当 作 他 是 记录 一 对 一 关系 的 东西 就 好 了 。m tbl 就 
是 用 来 记录 这 个 类 所 有 的 方法 的 名 称 (ID) 和 方法 实体 直接 对 应 关系 的 。 关 于 method 实 体 的 构 
造 方法 我 们 会 在 第 二 部 ， 第 三 部 进行 解说 。 


接 下 来 第 四 个 成 员 super 正 如 字面 意思 ， 保 存 着 父 类 的 信息 。 因 为 是 VALUE 所 以 指向 的 是 父 类 
的 类 的 对 象 (指针 )。Ruby 中 不 存在 父 类 的 类 只 有 Ojbect。( 译 者 注 :在 ruby1.6 之 前 是 如 此 ) 


实际 上 Object 里 面 的 所 有 方法 都 定义 在 Kernel 这 个 模块 中 。Object 只 是 将 其 引入 。 这 个 之 前 我 
们 也 已 经 讲 过 了 “。 模 块 的 功能 几乎 和 多 重 继承 相当 ， 一 见 似乎 只 0 
复杂 的 关系 ，ruby 中 正 是 用 了 巧妙 的 方法 使 其 看 起 来 只 是 单一 继承 。 这 个 操作 我 们 会 在 第 

章 “ 类 和 模块 "中 说 明 。 


另外 受 这 个 变化 的 影响 Object 的 结构 体 的 Super 的 内 容 是 Kernel 实 体 的 struct Rclass ， 后 者 的 
Super 被 定义 成 NULL。 换 名 话说 ，super 如 果 是 NULL 的 话 RClass 就 是 Kernel 的 实体 。 


umeric 





方法 的 搜索 


既然 类 呈现 这 样 的 构造 方式 那么 该 如 何 调用 方法 也 可 以 很 容易 想象 了 。 首 先 探索 对 象 类 的 
m_tbl|， 如 果 没 有 找到 就 继续 顺 着 super 在 父 类 中 的 m_tbl 中 寻找 ， 依 次 回溯 。 也 就 是 说 如 果 知 
道 Object 也 没有 找到 该 方法 ， 那 么 该 方法 就 是 还 未 定义 。 


按照 以 上 的 顺序 来 探索 m_tbl 的 方法 请 见 search_method()。 


256 static NODE* 
257 search_method(klass, id, origin) 


258 VALUE klass, *origin; 

259 ID id; 

260 { 

261 NODE *body; 

262 

263 If (!klass) return 9; 

264 while (!st_ lookup(RCLASS(klass)->m tbl, id, &body)) { 
265 klass = RCLASS(klass)->super,; 
266 if (!klass) return 9; 

267 } 

268 

269 If (origin) *origin = klass; 

270 return body; 

27 人 和 

(eval.c) 


这 个 函数 在 类 对 象 klass 中 了 寻找 名 称 为 id 的 方法 。 
RCLASS(value) 的 内 容 为 ((struct RClass*)(value)) 的 宏 。 


st_lookup() 是 用 来 在 st_table 中 检索 和 键 对 应 的 值 的 函数 。 如 果 找 到 值 就 返回 卜 ， 并 将 找到 的 
值 写 入 第 三 个 地 址 参数 (body)。 这 边 这 些 函 数 在 卷 尾 的 函数 参照 中 会 有 记载 ， 如 有 需要 可 以 随 
时 参考 。 

话说 来 每 次 都 进行 探索 的 话 实 在 是 太 慢 了 。 实 际 上 被 调用 的 参数 会 被 保存 到 缓存 中 ， 第 二 次 
就 不 必 每 次 都 用 super 方 法 来 回溯 寻找 了 。 包 括 缓存 的 搜索 我 们 会 在 第 十 五 章 "方法 "中 进行 介 


绍 。 

六 六 旦 

实例 变量 

这 章节 我 们 介绍 成 为 对 象 必须 条 件 的 第 三 点 ， 实 例 变量 的 实 装 。 


rb_ivar_set() 


实例 变量 是 一 种 以 对 象 为 单位 存放 其 特有 的 数据 的 方式 。 既然 是 对 象 特有 那么 好 像 将 数据 保 
存 到 对 象 内 部 (对 象 的 结构 体 ) 会 比较 好 ?那么 实际 上 是 个 什么 情况 呢 ? 我 们 来 看 一 下 将 实例 变 
量 带 入 对 象 中 的 函数 rb ivar_set() 一 探究 竟 。 


/* 向 obj 对 象 的 成 员 变 量 id 中 代入 val */ 


984 VALUE 
985 rb_ivar_set(obj, id, val) 
986 VALUE obj; 
987 ID id; 
988 VALUE val; 
989 { 
990 if (!0BJ_TAINTED(obj) && rb_safe level() >= 4) 
991 rb_raise(rb_eSecurityError, 
"Insecure: can't modify instance variable"); 
992 If (0BJ_FROZEN(obj)) rb_error_frozen("object"); 
993 Switch (TYPE(obj)) { 
994 case T_ OBJECT : 
995 case T_CLASS : 
996 case T_MODULE : 
997 if (!ROBJECT(obj)->iv_tb1) 
ROBJECT(obj)->iv_tb1l = st_init_numtable(); 
998 st_insert(ROBJECT(o0bj)->iv_ tbl, id, val); 
999 break; 
1000 default: 
1001 generic_ ivar_set(obj, id, val); 
1002 break; 
1003 } 
1004 return val; 
1005 } 


(variable.c) 


rb_raise() 和 rb_error_frozen() 都 是 错误 检测 。 这 之 后 我 们 会 反复 强调 ， 错 误 检测 虽然 在 现实 中 
是 需要 的 ， 但 是 不 是 处 理 的 本 质 。 所 以 第 一 次 读 代码 的 时 候 可 以 将 错误 处 理 完 全 忽略 。 


去 掉 了 错误 处 理 之 后 就 只 剩 下 了 swtich 语 名。 类 似 


Switch (TYPE(obj)) { 
case T_aaaa: 
case T_bbbb: 


} 


的 形式 是 ruby 特 有 的 书写 习惯 。TYPE() 返 回 对 象 构造 体 的 类 型 (T OBJECT 和 T_STRING 之 
类 ) 的 宏 。 类 型 flag 因 为 是 整数 所 以 完全 可 以 使 用 switch 分 支 。Fixnum 和 Symbol 虽 然 不 存在 构 
造 体 ， 但 是 会 在 TYPE() 中 j 进 行 特殊 处 理 进 而 返回 T_FIXNUM 和 T_SYMBOL ， 所 以 大 可 不 必 担 


接 下 来 我 们 回 到 rb_ivar_set() 。 好 像 就 只 有 T_OBJECT T_CLASS 和 TT _ MODULE 这 三 个 类 型 


的 处 理 是 分 开 来 单独 进行 的 。 这 三 个 被 选中 是 因为 他 们 的 结构 体 的 第 二 个 成 员 是 iv_tbl。 我 们 
来 实际 确认 一 下 。 


/* TYPE(val) == T_OBJECT */ 
295 struct RObject { 


296 struct RBasic basic; 
297 struct st_ table *iv_tbl; 
298 }; 


/* TYPE(val) == T_CLASS or T_MODULE */ 
300 struct RClass { 


301 struct RBasic basic; 

302 struct st_ table *iv_ tb]， 
303 struct st_ table *m tbl; 
304 VALUE Super ， 

305 }; 

(ruby.h) 


iv_tbl 对 应 的 是 Instance Variable Table， 也 就 是 实例 变量 表 。 里 面 记录 的 是 实例 变 
的 值 。 


我 们 再 来 贴 一 下 rb_ivar_set() 中 ， 当 结构 体 拥有 iv_tbl 成 员 时 的 处 理 代 码 。 


if (!ROBJECT(obj)->iv_tb1) 

ROBJECT(obj)->iv_tbl = st_init_numtable(); 
st_insert(ROBJECT(0bj)->iv_tbl, id, val); 
break; 


量 名 和 对 应 


ROBJECT() 是 用 来 将 VALUE 强 制 转换 成 struct RObject* 的 宏 。obj 指 向 的 也 有 可 能 是 struct 


Rclass， 但 是 仅仅 是 访问 第 二 成 员 变量 的 话 是 不 会 发 生 什 么 问题 的 。 


st_init numtable() 是 新 生成 st_table 的 函数 。st_insert() 是 在 st_table 中 生成 关联 的 函数 。 


综 上 所 述 这 段 代码 所 做 的 事情 ， 就 是 当 iv_table() 不 存在 的 时 候 新 建 一 个 ， 然 后 将 对 应 的 "变量 


名 => 对 象 "记录 到 其 中 。 


注意 一 点 ，Sstruct Rclass 自 身 是 类 对 象 的 结构 体 ， 所 以 其 变量 表 也 是 类 对 象 自己 的 东西 。 用 


ruby 程 序 来 说 ， 就 如 下 面 这 种 情况 。 


class C 
Q@ivar = "content" 
end 


generic_ivar_set() 


向 T OBJECTT MODULE T_CLASS 之 外 的 结构 体 代 入 变量 会 是 怎么 样 呢 ? 


# 没 有 iv_tb1 的 结构 体 

1000 defaujlt : 

1001 generic_ivar_set(obj, id, val); 
1002 break; 
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这 个 时 候 处 理会 交 给 generic_ivar_set()。 看 具体 的 函数 之 前 先 把 大 框架 说 明 一 下 吧 。 


T_OBJECTT _ MODULE T_CLASS 以 外 的 构造 体 是 没有 iv_tbl 成 员 的 (之 后 会 说 明 为 什么 没有 
的 理由 )。 但 是 就 算是 没有 该 成 员 也 可 以 通过 别 的 手段 将 实例 和 struct st_table 对 应 起 来 。ruby 
将 这 种 对 应 关系 保存 在 全 局 的 st_table， 即 generic_ iv_table 中 来 解决 此 问题 。 


St_table 


~ wst table 


~ wsSsttable 


generic_iv_table ~ wsSsttable 


~ st table 


~ st table 





我 们 来 看 一 下 实际 的 代码 。 


801 


830 
831 
832 
833 
834 
835 
836 
837 


838 
839 
840 


841 
842 
843 
844 


845 
846 
847 
848 
849 
850 
851 
852 
853 


static st_table *generic_iv_tbl; 


static void 
generic_ivar_set(obj, id, val) 
VALUE obj; 


} 


ID 


id; 


VALUE val; 


St 证 


yy 
if 
} 

Sg 
if 


} 
St 
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table *tbl; 


总 之 可 以 先 无 视 */ 
(rb_special const_p(obj)) { 
special generic ivar = 1; 


不 存在 generic_iv_ tb1 则 新 建 */ 
(!generic_iv_ tbl) { 
generic_iv tbl = st_init_numtable(); 


核心 处 理 */ 

(!st_lookup(generic_iv_tbl, obj, &tbl1)) { 
FL_SET(obj， FL_EXIVAR); 

tbl = st_init_numtable(); 

st_add_ direct(generic iv tbl, obj, tbl); 
st_add direct(tbl, id, val); 
return; 


insert(tbl, id, val); 


rb_special_const_p() 当 参数 不 是 指针 的 时 候 返 回 卜 。 这 个 if 语 句 里面 的 内 容 如 果 不 理解 垃圾 回 
收 机 制 的 话 是 无 法 说 明 的 ， 所 以 我 们 在 这 里 还 是 先 省 略 。 请 读者 在 阅读 第 五 章 的 垃圾 回收 机 
制 之 后 再 自行 理解 。 


st_init_numtable() 刚 才 也 出 现 了 ， 是 用 来 新 建 一 个 哈 希 表 。 


st_ lookup() 用 来 查找 和 key 对 应 的 值 。 这 个 时 候 会 查找 和 obj 所 关联 的 实例 变量 表 。 如 果 找 到 对 
应 的 值 豚 数 整体 就 返回 览 ， 在 第 三 个 地 址 参数 (&tbl) 中 记录 找到 的 对 应 值 。 也 就 是 
说 !st_lookup(...) 将 的 是 当 没 有 找到 对 应 记录 之 后 发 生 的 事情 。 


st_insert() 刚 才 也 说 过 了 “。 用 来 将 新 的 对 应 记录 保存 到 表 中 。 


st_add_ direct() 和 st_insert() 几 乎 相同 ， 区 别 在 于 后 者 会 在 追加 保存 记录 之 前 先 检查 一 下 键 是 
否 已 经 存在 。 也 就 是 说 如 果 使 用 st_add_ direct() 来 添加 新 记录 的 话 ， 如 果 已 经 有 相同 的 键 存 在 
于 表 中 ， 会 出 现 一 个 键 对 应 两 个 记录 的 情况 。 


所 以 能 直接 使 用 st_add direct() 的 情况 ， 基 本 上 是 刚刚 确认 过 键 不 存在 ， 或 者 是 刚刚 建立 新 的 
表 这 两 种 情况 。 这 段 代码 是 符合 这 些 情况 的 。 


FL_SET(obj, FL_EXIVAR) 是 用 来 设置 obj 的 basic.flags 为 FL_EXIVAR 的 宏 。basic.flags 的 所 有 
flag 都 是 FL_xxx 的 形式 ， 可 以 通过 FL_SET 来 设置 flag。 相 反 用 来 取消 对 应 flag 的 宏 叫 做 
FL_UNSET()。 另 外 ， 通 常 认为 FL_EXIVAR 的 EXIVAR 是 external instance variable 的 简称 。 


插入 这 个 flag 是 为 了 提高 访问 实例 变量 的 速度 。 如 过 发 现 没有 这 只 FL_EXIVAR 这 个 falg， 则 不 
用 通过 探索 generic_iv_tbl 也 可 以 知道 实例 变量 不 存在 。 相 比 之 下 当然 是 bit 的 校 验 比 起 探索 
struct st_table 来 的 速度 更 快 。 


结构 体 的 间 际 


现在 我 们 了 解 了 实例 变量 的 保存 方式 ， 那 么 为 什么 存在 没有 iv_table 的 结构 体 呢 ? 比如 struct 
RString 和 struct RArray 就 没有 iv_tbl， 这 个 是 为 什么 ?那么 干脆 直接 把 实例 变量 当 作 RBasic 的 
成 员工 了 。 


就 结论 来 说 ， 可 以 这 样 做 但 是 不 应 该 如 此 。 实 际 上 这 个 和 ruby 的 对 象 管理 机 制 紧 密 相 关 。 


ruby 中 字符 串 的 数据 (char[]) 所 占用 的 内 存 使 用 malloc 来 访问 。 但 是 对 象 的 结构 体 是 个 例外 。 
ruby 会 统一 管理 分 配 ， 从 而 访问 内 存 。 这 个 时 候 如 果 结构 体 的 种 类 (大 小 ) 参 差 不 齐 的 话 管理 起 
来 就 十 分 麻烦 。 所 以 将 所 有 的 结构 体 用 共用 体 Rvalue 来 申明 并 统一 分 配 管理 。 共 用 体 的 大 小 
会 和 成 员 中 最 大 的 保持 一 致 ， 所 以 如 果 单 独 有 一 个 结构 体 的 体积 非常 大 就 会 造成 很 大 的 浪 

费 ， 于 是 我 们 还 是 希望 素 有 的 结构 体 的 大 小 尽 可 能 保持 接近 。 


最 常用 的 结构 体 要 数 struct RString( 字 符 串 ) 了 吧 。 接 下 来 是 RArray( 数 组 )，RHash( 哈 希 )， 
RObject( 所 有 用 户 定 义 的 类 ) 。 那 么 问题 就 来 了 。struct RObject 的 内 容 只 有 sruct RBASIC 和 
一 个 指针 。 而 struct RString RHash RArray 却 已 经 使 用 了 struct Basic 和 三 个 指针 的 空间 。 也 就 
是 说 struct Robject 越 多 ， 就 会 造成 越 多 的 两 个 指针 空间 的 浪费 。 更 有 其 者 ，RString 如 果 使 用 
了 四 个 指针 ，RObject 实 际 上 就 只 占用 了 共用 体 的 一 半 不 到 的 空间 ， 实 在 是 太 浪费 了 。 


另 一 方面 配置 iv_tbl 的 好 处 主要 是 访问 速度 的 提升 和 内 存 空间 的 节省 ， 并 且 我 们 也 不 知道 这 个 
功能 会 不 会 被 频繁 使 用 。 实 际 上 在 ruby1.2 之 前 根本 就 没有 导入 过 generic_iv_tbl， 所 以 像 
String 和 Array 中 也 不 能 使 用 实例 变量 ， 就 算 如 此 也 没 发 生 什 么 大 问题 。 如 果 仅仅 因为 这 点 好 
处 就 浪费 大 量 的 空间 实在 是 太 春 了 。 


所 以 从 以 上 可 以 做 出 结论 ， 因 为 lv_tb| 而 增加 构造 体 的 体积 实在 是 无 奈 之 举 。 


960 VALUE 
961 rb_ivar_get(obj, id) 
962 VALUE obj; 
963 ID id; 
964 { 
965 VALUE val; 
966 
967 switch (TYPE(obj)) { 
7 A 
968 case T_OBJECT: 
969 case T_CLASS: 
970 case T_MODULE: 
971 if (ROBJECT(o0bj)->iv_tbl && 
st_lookup(ROBJECT(o0bj)->iv_tbl, id, &val)) 
972 return val; 
973 break; 
BO 
974 default: 
975 if (FL_TEST(obj， FL_EXIVAR) || rb_special const_p(obj)) 
976 return generic_ivar_get(obj, id); 
977 break; 
978 } 
A 0 
979 rb_warning("instance variable %s not initialized", rb_id2name(id)); 
980 
981 return QnNnil; 
982 } 
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结构 基本 相同 。 


(A)struct RObject 如 果 是 Rclass， 则 检索 iv_tbl。 刚 才 说 过 了 ， 有 可 能 iv_tbl 是 NULL， 所 以 不 先 
检查 一 下 的 话 会 出 错 。 接 着 st_lookup 会 在 找到 相应 记录 的 时 候 返 回 丨 。 这 个 jf 语句 整体 来 说 就 
是 "如 果 已 经 代入 过 此 实例 变量 则 返回 其 值 "。 


(C) 如 果 没 有 找到 对 应 的 值 ...... 也 就 是 说 如 果 想 要 访问 的 是 还 没有 被 代入 的 实例 变量 ， 那 么 跳 
过 if 和 switch， 直 接 运行 下 面 的 语句 。 这 个 时 候 会 发 生 rb_warning(), 并 返回 nil。 这 是 因为 ruby 
的 实例 变量 不 需要 代入 也 可 以 被 访问 。 


(B) 另 外 ， 当 结构 体 既 不 是 struct RObject 也 不 是 RClass 的 时 候 ， 首 先 从 generic_ iv_ tbl 中 寻找 
对 象 的 实例 变量 表 。generic ivar_ get() 实 现 的 功能 不 用 我 说 也 能 想到 。 另 外 需要 注意 的 是 if 语 
铅 。 


刚才 说 过 将 进行 过 generic_ivar_set() 处 理 的 对 象 插入 FL_EXIVAR。 在 这 里 这 个 flag 使 得 运行 高 
速 化 的 特征 就 显现 出 来 了 。 


rb_special_const_p() 是 什么 玩意 儿 ? 这 个 函数 当 obj 不 存在 结构 体 的 时 候 为 版 。 因 为 不 存在 构 
造 体 所 以 也 不 需要 basic.flags( 因 为 根本 无 从 插入 flag)。 所 以 FL _xxx() 遇 到 这 种 对 象 总 是 会 返回 
假 。 于 是 这 里 对 待 rb_special const p() 为 真 的 对 象 必 须 格 外 小 心 咽 曙 。 


对 象 的 结构 体 


这 小 节 中 我 们 简要 介绍 对 象 结构 体 最 重要 的 具体 内 容 的 的 处 理 方法 。 
struct RString 


314 struct RString { 


315 struct RBasic basic; 
316 long len; 

317 char *ptr; 

318 union { 

319 long capa; 

320 VALUE shared; 
321 } aux; 

32200 
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ptr 是 指向 字符 串 的 指针 ，len 是 字符 串 的 长 度 ， 非 常 直 观 。 


Ruby 的 字符 串 与 其 说 是 字符 串 不 如 说 是 字符 序列 。 因 为 可 以 包含 NUL 在 内 的 任何 字符 。 所 以 
在 ruby 中 就 算 在 终端 设置 NUL 也 没有 多 大 意义 ， 不 过 因为 C 的 函数 中 要 求 NUL, 所 以 为 了 便利 
还 是 将 NUL 设 置 成 字符 串 的 终端 ? 但 是 NUL 是 不 包含 在 len 之 中 的 。 


另外 解释 器 和 扩展 库 中 处 理 字 符 串 的 时 候 可 以 通过 RSRTING(str)->ptr` “RSTRING(str) 来 访问 
ptr 和 len。 但 是 要 注意 以 下 几 点 。 


。 检查 str 是 否 确实 指向 struct RString。 

。 可 以 访问 成 员 但 是 不 能 改变 其 内 容 

。 不 可 以 将 RSTRING(str)->ptr 保 存 到 诸如 临时 变量 之 中 供 之 后 使 用 。 
这 是 为 什么 ? 其 中 一 个 原因 是 软件 工程 学 上 的 原则 。 不 可 以 随便 修改 别人 的 数据 。 既 然 有 接 
口 函 数 就 率 乖 使 用 接口 函数 。 不 过 还 有 其 他 不 允许 擅自 访问 和 保存 指针 的 理由 ， 这 和 第 四 个 
成 员 变量 aux 有 关 。 但 是 要 详细 说 明 aux 的 使 用 方法 又 必须 得 详细 说 明 ruby 字 符 串 的 一 些 特 


征 。 


ruby 的 字符 串 自身 是 可 以 改变 的 (mutable), 所 谓 的 变化 是 指 


SE = ry # 生成 字符 串 代 入 s 
s.concat("ing") # 向 字符 串 s 中 追加 "jng"。 
p(s) # 输出 "string" 


这 样 s 指 向 的 对 象 的 内 容 就 变 成 了 "string"。java 和 Python 的 字符 串 是 没有 这 种 特性 的 。 硬 要 说 
的 话 ， 这 个 特性 和 Java 的 StringBuffer 很 接近 。 


接 下 来 我 们 来 看 看 他 们 之 间 到 底 有 什么 关系 。 首 先 既 然 可 以 发 生 改 变 自 然 字符 串 的 长 度 |len 也 
会 改变 。 既 然 长 度 发 生 改 变 那 么 这 个 时 候 内 存 的 分 配 就 会 发 生 增 减 。 当 然 也 可 以 使 用 
realloc()， 但 是 malloc 和 realloc 这 些 操 作 都 太 重 了 ， 仅 仅 是 为 了 变更 字符 串 就 realloc() 一 次 的 
话 实在 是 负担 太 大 了 。 


于 是 ptr 所 指向 的 内 存 空间 通常 会 比 len 稍 微 长 一 点 。 这 样 的 话 追 加 的 字符 串 正 好 能 放 入 多 余 的 
内 存 中 就 可 以 不 必 调 用 realloc() 了 ， 这 样 的 话 速度 就 上 去 了 。 结 构 体 中 的 aux.capa 保 存 的 就 是 
这 个 多 余 的 长 度 。 

那么 另 一 个 aux.shared 是 什么 玩意 儿 呢 。 这 个 也 是 为 了 提高 从 字符 串 序 列 中 生成 对 象 的 速度 
而 采用 的 机 制 。 请 看 下 面 的 ruby 程 序 。 


while true do # 永远 地 重复 


= cGy # 将 内 容 是 "str" 的 字符 串 放 入 a 
a.concat("ing") # 向 a 中 追加 "ing"。 
p(a) # 输出 string 

end 


不 管 是 循环 多 少 次 总 会 在 第 四 行 的 p 出 输出 "string"。 放 在 一 般 情况 下 那 就 得 每 次 通过 "str" 这 个 
式 子 新 建 一 个 char[] 类 型 的 字符 串 对 象 。 但 是 对 于 字符 串通 常情 况 下 都 不 会 做 任何 改变 ， 这 个 
时 候 就 会 造成 多 次 复制 char[] 的 资源 浪费 。 于 是 我 们 就 期 望 能 够 共用 一 个 char[] 。 


作为 共用 所 存在 的 就 是 aux.shared 这 个 东西 了 。 使 用 表达 式 生 成 的 字符 串 对 象 都 会 共用 同一 
个 char[]。 只 有 当 申 正 发 生变 化 时 候 才 会 专门 去 申请 内 存 分 配 。 使 用 共用 的 char[] 的 结构 体 中 
的 basic.flags 标 志 中 会 被 设立 ELTS_SHARED 这 个 标志 。aux.shared 会 保存 原来 的 对 象 。 
ELTS 是 elements 的 简称 。 


我 们 回 到 RSTRING(str)->ptr 的 话题 中 。 之 所 以 可 以 访问 但 不 能 改变 指针 对 象 是 因为 这 会 使 得 
len 和 capa 的 值 和 申 实 情况 不 符 。 另 外 如 果 要 改变 用 序列 表达 式 所 新 建 的 字符 串 对 象 的 内 容 ， 
则 需要 把 对 象 中 的 aux.shared 成 员 移 除 。 


最 后 我 们 来 列举 几 个 使 用 RString 的 例子 。str 可 以 看 成 是 指向 RString 的 value。 


RSTRING( str)->len; WE 
RSTRING(str)->ptr[0]; /* 第 一 个 字符 */ 


str = rb_str_new("content"，7); /* 生成 内 容 是 "content" 的 字符 串 。 
第 二 个 参数 是 其 长 度 */ 


str = rb_str_new2("content"); /* 生成 内 容 是 "content" 的 字符 串 。 
长 度 会 使 用 Strlen() 来 计算 */ 
rb_str_cat2(str, "end"); /* 在 Ruby 字 符 串 中 后 接 C 的 字符 串 */ 


struct RArray 
struct RArray 是 存放 Ruby 的 数组 实例 的 结构 体 。 


324 struct RArray { 


325 struct RBasic basic; 
326 long len; 

327 union { 

328 long capa; 

329 VALUE shared; 
330 } aux; 

331 VALUE *ptr; 

332 }; 


(ruby.h) 


除了 ptr 之 外 几乎 和 struct RString 一 样 。ptr 指 向 的 是 数组 的 内 容 ，len 是 其 长 度 。aux 的 用 法 和 
struct RString 中 介绍 的 相同 。aux.capa 是 ptr 所 指向 的 内 存 的 站 正 的 长 度 ，aux.shared 则 是 当 
数组 为 共用 的 时 候 指向 共用 数组 的 指针 。 


访问 成 员 的 方法 也 和 RString 类 似 。 通过 RARRAY(arr)->ptr 和 RARRAY(arr)->len 可 以 访问 成 员 
但 是 不 能 改变 成 员 的 内 容 。 我 们 来 看 一 下 简单 的 例子 。 


/* 用 C 语 言 操作 数组 */ 


VALUE ary; 

ary = rb_ary_new(); /* 生成 空 的 数组 */ 
rb_ary_push(ary，INT2FIX(9));  /* 将 Ruby 的 9 加 入 数组 */ 
RARRAY (ary)->ptr[0]; /* 访问 编号 是 9 的 元 素 */ 
rb_p(RARRAY(ary)->ptr[0]); /* 输出 ary[0] (输出 9) */ 
# 用 ruby 进 行 操作 

ary = [] # 生成 空 的 数组 

ary.push(9)  # 将 Ruby 的 9 加 入 数组 

ary[9] # 访问 编号 是 9 的 元 素 


p(ary[9]) # 输出 ary[0] (输出 9) 


struct RRegexp 
RRepexp 是 存放 正则 表达 式 的 结构 体 。 


334 Struct RRegexp { 


335 struct RBasic basic; 

336 struct re_pattern_buffer *ptr; 
337 long len; 

338 char *str; 

339 }; 
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ptr 是 已 经 编译 好 的 正则 表达 式 。str 是 编译 前 的 正则 表达 式 (正则 表达 式 的 源码 )，|len 是 其 长 
度 。 


处 理 Rexgexp 对 象 的 代码 本 书 中 将 不 会 出 现 所 以 这 里 就 省 略 了 。 就 算 要 在 扩展 库 中 使 用 ， 只 
要 不 涉及 很 特殊 的 用 法 ， 参 考 一 些 接 口 函 数 就 应 该 足够 了 吧 。 


struct RHash 
struct RHash 是 哈 希 表 Hash 实 例 所 在 的 结构 体 。 


341 Struct RHash { 


342 struct RBasic basic; 
343 struct st_ table *tbl; 
344 int iter_lev; 

345 VALUE ifnone; 

346 }; 


(ruby.h) 


其 实 这 个 是 struct st_table 的 wrapper。 关 于 st_table 我 们 会 在 下 一 章 "名 称 和 命名 表 " 中 详细 解 
说 。 


ifnone 存 放 的 是 搜索 失败 时 候 使 用 的 键 ， 默 认 是 nil。iter_ lev 是 为 了 哈 希 表 的 re-entrance( 多 进 
程 安全 ) 存 在 的 。 


struct RFile 
struct RFile 是 服务 钥 入 类 |o 和 其 后 继 子 类 实例 的 构造 体 。 


348 struct RFilje { 


349 struct RBasic basic; 
350 struct OpenFile *fptr; 
351 }; 

(ruby.h) 


19 typedef struct OpenFile { 


20 BLBES > /* stdio ptr for read/write */ 

21 BEEES SF2. /* additional ptr for rw pipes */ 
22 int mode; /* mode flags */ 

23 int pid; /* child's pid (for pipes) */ 

24 int lineno; /* number of lines read */ 

25 char *path ; /* pathname for file */ 

26 void (*finalize) _((struct OpenFile*)); /* finalize proc */ 


27 } Openrile; 


(rubyio.h) 


成 员 几 乎 都 保存 在 了 struct OpenFile 中 。1IO 对 象 的 实例 并 不 多 所 以 可 以 这 样 存放 。 各 个 成 员 的 
用 途 都 有 些 。 基 本 上 是 C 语 言 stdio 的 warpper 。 
struct RData 


struct RData 和 目前 为 止 介 绍 的 东西 目的 都 不 一 样 。 这 个 主要 是 为 了 存放 扩展 类 的 结构 体 。 


编写 扩展 库 的 类 的 实体 当然 也 需要 一 个 结构 体 来 存放 。 但 是 结构 体 的 类 型 是 生成 的 类 所 决定 
的 ， 所 以 无 法 事先 知道 类 的 大 小 和 结构 。 于 是 ruby 提 供 了 一 个 "管理 用 户 自 定义 的 结构 体 指针 
的 结构 体 "， 这 个 东西 就 是 struct RData 了 。 


353 struct RData { 


354 struct RBasic basic; 

355 void (*dmark) _((void*)); 
356 void (*dfree) _((void*)); 
357 void *data; 

358 }; 

(ruby.h) 


data 是 指向 用 户 定义 的 构造 体 的 指针 。dfree 是 释放 自 定义 构造 体 的 函数 ，dmark 是 mark and 
SWeep 中 进行 mark 的 函数 (涉及 垃圾 回收 ) 


关于 struct RDdata 的 说 明 现 在 还 不 是 时 候 ， 总 之 先 看 图 吧 。 详 细 的 内 容 我 们 会 在 第 五 章 的 " 垃 
圾 回收 "中 介绍 。 


struct RData 





VALUE 





第 三 齐 名 称 和 命名 表 


st_table 


作为 存储 方法 的 表 和 实例 变量 的 表 ，st table 已 经 出 现 过 几 次 了 。 本 章 首先 就 st_table 做 详细 
的 说 明 。 


概要 


我 们 已 经 说 过 st_table 是 哈 布 表 。 哈 布 表 是 保存 一 对 一 对 应 关系 的 数据 结构 。 这 种 一 对 一 关系 
可 以 是 变量 名 和 变量 的 值 ， 也 可 以 是 函数 名 和 函数 的 实体 ， 等 等 。 


当然 除了 哈 希 表 也 可 以 用 其 它 的 数据 结构 来 表示 一 一 对 应 关系 。 比 如 可 以 下 面 这 种 list 的 结构 
体 。 


struct entry { 

ID key; 

VALUE val; 

struct entry *next; /* 指向 下 一 个 元 素 */ 
}; 


但 是 这 种 方法 很 慢 。 如 果 存 在 1000 个 元 素 的 话 ， 最 糟糕 的 情况 下 要 遍历 1000 次 这 个 链表 。 也 
就 是 探索 的 时 间 和 元 素 的 个 数 是 成 正比 的 。 这 样 的 话 就 会 很 糟糕 。 所 以 从 很 早 就 考虑 了 各 种 


解决 方法 。 哈 希 表 就 是 这 个 解决 方法 的 一 种 。 也 就 是 说 哈 希 表 并 不 是 仅 有 的 方法 ， 但 是 能 够 
带 来 高 速 化 的 处 理 。 


接 下 来 我 们 实际 来 看 st_table。 注 意 看 ， 这 个 库 并 不 是 松本 先生 的 原创 。 


1 /* This is a public domain general purpose hash table package 
written by Peter Moore @ UCB. */ 


(st.c) 


本 辕 至 少 注 释 是 这 么 说 的 。 


顺带 一 提 ， 用 谷歌 检索 到 的 其 他 版 本 的 注释 上 说 ，st table 是 string table 的 简称 。 但 是 我 认为 
general purpose 和 string 到 底 是 有 些 矛盾 的 ...... 。 


所 谓 哈 布 表 
哈 希 表 的 设想 如 下 。 首 先 有 一 个 长 度 为 n 的 数组 。 比 如 说 n=64 。 





然后 准备 一 个 能 够 将 键 映 射 到 0 到 n-1(0~63) 的 整数 ij 的 函数 f。 这 个 f 被 叫做 哈 希 函数 。 对 于 同一 
个 键 ，f 必 须 保 证 每 次 都 返回 相同 的 ij。 假设 键 的 值 是 整数 的 话 ， 这 个 整数 被 64 整 除 的 余数 肯定 
是 在 0 到 63 之 间 的 。 所 以 这 个 取 余 的 计算 可 以 成 为 f 函 数 。 

要 找到 对 应 关系 的 存储 位 置 的 时 候 ， 先 对 键 调用 哈 希 函数 f， 求 得 i 的 值 ， 然 后 数组 的 第 i 个 元 素 
就 好 了 。 也 就 是 说 ， 因 为 访问 数组 的 某 个 元 素 是 十 分 快速 的 ， 所 以 只 需要 找到 某 种 方法 把 键 
转换 成 整数 就 好 了 ， 这 个 就 是 hash 的 核心 思想 。 


所 一 





可 异世 界 上 是 没有 这 么 理想 的 情况 的 。 这 个 方法 有 个 致命 的 问题 。n 现 在 只 有 64 个 元 素 ， 所 以 
当 需 要 对 应 64 个 以 上 的 元 素 键 的 话 肯 定 会 发 生 重 复 。 就 算 键 没 超过 64 个 ， 也 有 可 能 发 生 两 个 
键 对 应 相同 的 索引 的 情况 。 比 如 刚才 用 64 取 余 的 的 方法 ， 当 键 的 值 是 65 或 者 129 的 时 候 ， 对 应 
的 哈 希 值 都 是 1。 我 们 把 这 个 叫做 哈 布 冲突 。 解 决 冲突 的 方法 主要 有 几 种 。 

比如 发 生 冲 突 的 话 可 以 按照 下 面 的 方法 放 入 元 素 。 这 个 方法 叫做 开放 定 址 法 。 


所 一 






另外 有 一 种 方法 ， 不 是 直接 将 元 素 存 在 数组 中 ， 而 是 在 数组 中 存放 一 个 个 链表 的 指针 。 发 生 
冲突 的 时 候 逐 渐 延 长 链表 的 长 度 。 这 个 方法 叫做 连锁 法 。st_table 采 用 的 就 是 这 个 连锁 法 。 


于 一 


值 了 千 》 子 yy7 双 3 信 疆 岂 计 工人 术 为 DD 区 


储 太志 家 之 。 


说 来 如 果 能 够 实现 知道 键 的 集合 的 内 容 的 话 也 许可 以 设计 出 一 个 绝对 不 会 发 生 冲 突 的 哈 希 函 
数 。 这 个 函数 被 叫做 绝对 哈 希 函数 。 然 后 还 有 针对 任何 的 字符 串 的 集合 来 生成 哈 希 函数 的 工 
具 ， 上 比如 说 GNU 的 gperf。ruby 的 语法 解析 器 实际 上 也 用 到 了 这 个 工具 ...... 还 不 是 说 这 个 的 时 
候 。 我 们 会 在 第 二 部 分 继续 介绍 。 


数据 结构 


现在 我 们 来 看 实际 的 代码 。 在 序章 中 已 经 说 过 ， 如 果 同 时 存在 数据 类 型 和 代码 的 话 当然 是 先 
读数 据 类 型 。 下 面 我 们 来 看 一 下 st_table 实 际 使 用 的 数据 类 型 。 


9 typedef struct st_ table st_ table; 


16 Struct st_ table { 


17 struct st_hash_type *type; 
18 int num_bins; /* 档 的 个 数 “7 
19 int num_entries; /* 总 共存 放 的 元 素数 */ 
20 struct st_table entry **bins; 1 
21 )}; 
(st.h) 


16 Struct st_ table entry { 


17 unsigned int hash 
18 char *key 
19 char *record 
20 st_table_entry *next; 
2 
(st.c) 


st_table 是 主体 的 表 的 结构 ，st_table_entry 是 存放 元 素 的 地 方 。st_table_entry 有 一 个 成 员 叫 
做 next， 因 为 是 链表 所 以 当然 需要 啦 。 这 个 就 是 连锁 法 的 连锁 的 地 方 。 我 们 发 现 其 使 用 了 
st_hash_type 的 类 型 ， 我 们 会 稍 后 对 此 说 明 首 先 就 别 的 地 方 对 照 下 图 进行 逐一 确认 好 了 。 


struct st_table 


num_entries = 3 





num_bins = 5 St_table_entry 
bins 


St_table_entry 





接 下 来 我 们 来 看 st_hash_ type。 


11 struct st_hash_type { 


12 int (*compare)(); /* 上 比较 函数 */ 
13 int (*hash)(); /* 哈 希 函数 */ 
14 }; 

(st.h) 


int (*compare)() 


这 个 表示 的 是 返回 int 的 函数 指针 成 员 compare。hash 也 是 同 理 。 这 种 变量 用 下 面 的 方法 代 
入 o 
Int 


great_function(int n) 


{ 
/* ToDo */ 
return n; 


int (*f)(); 
f = great_function; 


然后 用 下 面 的 方法 调用 。 


(*f)(7); 


现在 回 到 st_hash_type 的 解说 。hash compare 这 个 两 个 成 员 中 ，hash 就 是 之 前 说 过 的 哈 希 函 
数 。 

compare 则 是 用 来 判断 键 是 否 是 同一 个 的 函数 。 因 为 连锁 法 中 相同 的 哈 希 值 n 的 地 方 会 存放 多 
个 要 素 。 为 了 知道 其 中 哪个 元 素 才 是 我 们 丨 正 需 要 的 ， 这 就 需要 有 一 个 可 以 完全 信任 的 比较 


函数 。 这 个 比较 函数 就 是 compare。 


这 个 st_hash_type 是 一 种 很 巧妙 的 通用 化 方法 。 哈 希 表 是 无 法 确定 自己 保存 的 键 的 类 型 的 。 
比如 ruby 的 st_table 的 键 损 是 ID，char*，VALUE 。 如 果 每 种 类 型 都 要 设计 一 种 哈 希 的 话 实在 
是 太 夯 了 。 因 为 键 的 类 型 不 同 而 导致 改变 的 仅仅 是 哈 希 函数 的 部 分 而 已 ， 无 论 是 分 配 内 存 还 
是 检测 冲突 的 大 部 分 代码 都 是 相同 的 。 于 是 我 们 仅仅 把 不 同 的 地 方 作为 函数 特 化 起 来 ， 用 函 
数 指针 来 制定 其 具体 函数 来 使 用 。 这 样 的 话 就 可 以 使 本 来 就 占据 着 大 部 分 代码 的 哈 希 表 的 实 
装 更 加 灵活 。 


面向 对 象 的 语言 本 身 就 把 对 象 和 过 程 捆绑 在 一 起 所 以 这 种 构造 是 没有 必要 的 。 或 者 说 这 种 构 
造作 为 语言 的 功能 已 经 被 齿 入 进去 了 。 


st_hash_type 的 例子 


st_hash_type 的 结构 体 虽 然 是 一 种 很 成 功 的 通用 方法 ， 但 是 也 是 的 代码 变 得 复杂 难 懂 起 来 。 
不 具体 看 一 下 hash 和 compare 函 数 的 话 总 是 没有 什么 实感 。 于 是 现在 就 可 以 来 看 看 上 一 章 也 
出 现 的 st_init_numtable() 驾 数 了 。 这 个 对 应 整数 键 值 的 哈 希 函数 。 


182 st_table* 

183 st_init_numtable() 

184 { 

185 return st_init_ table(&type_numhash); 
186 } 


(st.c) 


st_init_table() 是 给 表 分 配 内 存 的 函数 ，type_numhash 的 类 型 是 st_hash type。 
type_numhash 的 内 容 如 下 


37 Static struct st_hash_ type type_numhash = { 
38 numcmp, 

39 numhash, 

40 }; 


552 static int 
553 numcmp(x, y) 


554 long x, y; 

S55 { 

556 return x != y; 
S57 


559 static int 
560 numhash(n) 


561 long n; 
562 { 

563 return n; 
564 } 

(st.c) 


实在 是 太 简单 。ruby 的 解释 器 用 的 表 基 本 上 使 用 的 是 type_numhash 。 


st_lookup() 


接 下 来 我 们 来 看 哈 希 结构 体 里 面 的 函数 ， 从 开始 可 以 先 从 探索 函数 入 手 。 哈 希 表 中 的 探索 函 
数 st_lookup() 内 容 如 下 。 


247 int 
248 st_lookup(table, key, value) 


249 st_table *table; 

250 register char *key; 

251 char **value; 

252 { 

253 unsigned int hash_val, bin_pos; 

254 register st_table_ entry *ptr; 

255 

256 hash_val = do_hash(key, table); 

257 FIND_ENTRY(table, ptr, hash_val, bin_pos); 
258 

259 If (ptr == 0) { 

260 return 0; 

261 } 

262 else { 

263 if (value != 0) *value = ptr->record; 
264 return 1; 

265 } 

266 } 

(st.c) 


重要 的 部 分 几乎 都 在 do_hash() 和 FIND_ENTRY() 里 面 ， 我 们 按 着 顺序 来 看 。 
do_hash() 


68 #define do_hash(key,table) (unsigned int)(*(table)->type->hash)((key)) 


(st.c) 


保险 起 见 我 们 还 是 把 宏 里 面 的 复杂 的 部 分 单独 抽取 出 来 


(table)->type->hash 


这 个 函数 指 生 人 就 调用 了 相关 的 函数 。* 的 内 容 不 是 table( 而 是 表示 这 个 带 
参数 的 函数 指针 )。 也 就 是 说 ， 这 个 宏 使 用 按照 类 型 定义 的 不 同 的 哈 希 函数 type->hash， 带 上 
参数 key 来 求 哈 希 值 。 


接 下 去 我 们 来 看 FIND_ENTRY() 。 


235 #define FIND_ENTRY(table, ptr, hash_val, bin_pos) do 人 


236 bin_pos = hash_val%(table)->num_bins;\ 

237 ptr = (table)->bins[bin_pos];\ 

238 if (PTR_NOT_EQUAL(table, ptr, hash_val, key)) {\ 

239 COLLISION;\ 

240 while (PTR_NOT_EQUAL(table, ptr->next, hash_val, key)) 人 
241 ptr = ptr->next;\ 

242 }\ 

243 ptr = ptr->next;\ 

244 }\ 


245 } while (0) 


227 #define PTR_NOT_EQUAL(table, ptr, hash val, key) ((ptr) != 0 && \ 
(ptr->hash != (hash_val) || !EQUAL((table), (key), (ptr)->key))) 


66 #define EQUAL(table,x,y) \ 
((x)==(y) || (“table->type->compare)((x),(y)) == 9) 


(st.c) 
COLLISION 是 用 来 debug 的 宏 ， 直 接 无 视 好 了 。 
FIND_ENTRY() 的 参数 从 前 向 后 分 别 是 
1.st_table 
2. 应 该 使 用 的 临时 变量 
3. 哈 希 值 
4. 检 索 的 键 
第 二 个 参数 用 来 保存 查询 到 的 st_table_entry* 的 值 。 


另外 最 外 面 一 层 为 了 保证 由 多 个 式 子 组 成 的 宏 安全 执行 ， 使 用 了 do~while(0)。 这 个 是 ruby ， 
严格 来 说 是 Cc 语言 的 预 处 理 的 风格 。 使 用 if(1) 的 话 会 不 小 心 带 上 else。 i ) 的 话 最 后 
还 需要 break。 


while(0) 的 后 面 不 接 分 号 也 是 有 讲究 的 。 如 果 你 硬 要 问 为 什么 ， 请 看 


FIND_ENTRY( ) ; 


一 般 都 是 这 ， 所 以 最 后 的 就 不 会 多 出 来 一 个 分 号 。 


st _ add _direct() 


ee 的 函数 st_add_direct()。 这 个 函数 不 检查 键 是 
录 ， 而 是 无 条 件 得 追加 新 的 项 目 。 这 个 就 是 direct 的 意思 。 


克 
(8 
深 
| 


308 void 
309 St_a 
310 

311 

312 

312、 
314 

315 

316 

317 

318 

319 } 


(st.c) 


dd_direct(table, key, value) 
st_table *table; 

char *key; 

char *value; 


unsigned int hash_val, bin_pos; 


hash_val = do_hash(key, table); 
bin_pos = hash_val % table->num_bins; 


ADD_DIRECT(table, key, value, hash_val, bin_pos); 


和 刚才 一 样 为 了 求 哈 希 值 使 用 了 宏 do_hash(), 接 下 来 的 计算 也 在 FIND_ENTRY() 的 开头 出 现 
过 ， 哈 希 值 就 实际 的 索引 号 。 


然后 插入 过 程 自身 是 依靠 ADD_DIRECT 执 行 。 从 名 字 就 可 以 看 出 这 是 一 个 宏 。 


268 #def 
269 do{ 
270 
271 


272 
273 
274 
275 


276 
277 
278 
279 
280 


281 
282 
283 
284 } wh 


(st.c) 


ine ADD_DIRECT(table, key, value, hash_val, bin_pos) 


st_table_entry *entry; 
if (table->num_entries / (table->num_bins) 


> ST_DEFAULT_MAX_DENSITY) { 


rehash(table); 

bin_pos = hash_val % table->num_bins; 
} 
We 


entry = alloc(st_table_entry); 


entry->hash = hash_val; 

entry->key = key; 

entry->record = value; 

ZB 

entry->next = table->bins[bin_pos]; 
table->bins[bin_pos] = entry; 
table->num_entries+t+; 

ile (0) 


开头 的 if 是 例外 处 理 的 内 容 ， 我 们 稍 后 看 ， 首 先 看 下 面 的 。 


(A) 分 配 st_ta 


ble_entry， 进 行 初始 化 


0 


(B) 向 链表 开头 追加 entry。 这 个 是 处 理 链表 的 风格 。 也 就 是 说 通过 


entry->nex 
list_beg = 


可 以 向 链表 外 


t = list_beg; 
entry; 


9 开头 追加 元 素 。 这 也 是 Lisp 的 术语 "cons" 尼 


码 也 是 可 以 通用 的 。 


最 后 看 一 下 被 我 们 搁置 的 代码 。 


ADD_DIRECT() 一 rehash 


音 田 
忌 心 


。 就 算 list_beg 是 NULL， 这 段 代 


271 if (table->num_entries / (table->num_bins) \ 

> ST_DEFAULT_MAX_DENSITY) { \ 
272 rehash(table); \ 
273 bin_pos = hash_val % table->num_bins; \ 
274 } N 
(st.c) 


DENSITY 就 是 所 谓 浓 度 ， 也 就 是 使 用 这 个 条 件 式 判 断 哈 希 表 是 否 as st_table 中 如 
果 所 在 同一 个 bin_pos 的 值 过 多 的 话 ， 链 表 就 会 变 成 ， 搜 索 速 度 就 会 。 所 以 当 元 素 个 数 过 
多 的 时 候 ， 我 们 增加 bin 的 大 小 来 缓解 这 种 拥挤 。 


现在 所 设 定 的 ST_DEFAULT_MAX_DENSITY 如 下 


23 #define ST_DEFAULT MAX_DENSITY 5 


(st.c) 


这 个 浓度 被 设置 成 了 5， 也 就 是 说 当 所 有 的 bin_pos 链 表 的 元 素 st_table_entry 都 已 经 达到 5 个 的 
情况 下 ， 我 们 就 要 增 大 容量 。 


st_insert() 


st_insert() 不 过 是 st_add_direct() 和 st_lookup() 的 组 合 而 已 。 只 要 了 解 后 两 者 就 Ok 了。 


286 int 

287 st_insert(table, key, value) 

288 register st_table *table; 

289 register char *key; 

290 char *value; 

291 { 

292 unsigned int hash_val, bin_pos; 
293 register st_table _ entry *ptr; 
294 

295 hash_val = do_hash(key, table); 
296 FIND_ENTRY(table, ptr, hash_val, bin_pos); 
297 

298 If (ptr == 0) { 

299 ADD_DIRECT(table, key, value, hash_ val, bin_pos); 
300 return 0; 

301 } 

302 else { 

303 ptr->record = Value ' 

304 return 1; 

305 } 

306 } 

(st.c) 


首先 查询 元 素 是 已 经 被 添加 到 哈 希 表 中 ， 如 果 还 没有 ， 就 向 哈 希 表 中 添加 元 素 ， 实 际 上 添 
加 了 元 素 则 返回 夏 ， 如 果 没 有 添加 就 返回 假 。 


ID 和 符号 


我 们 已 经 说 明 过 ID 是 什么 东西 。ID 是 和 任意 的 字符 串 一 一 对 应 的 数值 ， 可 以 表示 各 种 名 称 。 
实际 的 ID 的 类 型 是 unsigned int。 


从 char 到 ID 
字符 串 到 ID 的 变化 通过 rb_intern() 进 行 。 这 个 函数 略 长 我 们 省 略 其 中 一 部 分 。 


rb_intern()〈 缩 减 版 ) 


5451 Static st_table *sym_ tbl; /* char* -, ID 3 
5452 static st_table *sym_rev_tbl; /* ID -~ char* yh 
5469 ID 
5470 rb_intern(name) 
5471 const char *name; 
5472 { 
5473 const char *m = name; 
5474 ID id; 
5475 int last; 
5476 
/* 既 代 name 人 这 对 应 才 在 ID 从 登录 站 所 工大 号 去 所在 返 可 */ 
5477 if (st_lookup(sym_ tbl, name, &id)) 
5478 return id; 


/* 省 略 …. 新 LVID 在 作 耕 */ 


/x_namecIDO 阅 速 在 登录 才 吾 */ 
5538 id_regist: 


5539 name = strdup(name); 

5540 st_add_ direct(sym tbl, name, id); 
5541 st_add_ direct(sym_rev_tbl, id, name); 
5542 return id; 

5543 } 

(parse.y) 


字符 囊 和 |D 的 一 一 对 应 使 用 st_table 来 实现 。 应 该 不 是 什么 难点 。 


要 说 我 们 省 略 了 什么 ， 那 就 是 当 遇 到 全 局 变量 或 者 实例 变量 的 时 候 我 们 会 进行 特殊 处 理 插入 
标记 位 。 因 为 ruby 的 语法 解析 器 需要 从 ID 获取 变量 的 类 型 。 但 是 这 些 又 和 ID 的 原理 没 多 大 联 
系 所 以 这 里 就 不 贴 出 来 了 。 


从 ID 到 char* 


rb_intern() 的 逆向 ， 从 ID 获取 char* 使 用 的 是 rb_id2name() 这 个 函数 。 2 该 已 经 明白 
id2name 的 2 是 to 的 意思 。 因 为 to 和 two 发 音 相同 所 以 被 蔡 代 使 用 了 。 这 个 写法 出 乎 意料 相当 常 
见 。 


A 各 种 flag 标 记 ， 所 以 变 得 很 长 。 我 们 尽量 删 掉 无 关 紧 要 的 部 分 
J 部 数 。 


rb_id2name( 阁 割 版 ) 


char * 
rb_id2name(id) 


ID id; 
{ 
char *name; 
If (st_lookup(sym_rev_tbl, id, &name)) 
return name; 
return 0; 
} 
是 不 是 觉得 有 些 过 于 简单 了 。 只 是 删除 掉 了 一 些小 细节 。 


这 里 需要 注意 ， 我 们 没有 找 贝 需要 检索 的 name。Ruby 的 API 的 返回 值 不 需要 free()( 绝 对 不 能 
free)。 另 外 传递 参数 的 时 候 通常 会 通过 拷贝 来 使 用 。 也 就 是 说 生成 和 释放 通常 是 用 户 或 者 
ruby 的 一 方 来 执行 完成 的 。( 谁 生成 谁 释放 ) 


那么 对 于 生成 和 释放 无 法 相对 应 的 值 (一 旦 被 传递 就 无 法 控制 ) 是 如 何 处 理 的 呢 ? 这 个 时 候 会 要 
求 使 用 Ruby 对 象 。Ruby 对 象 会 在 我 们 不 需要 的 时 候 自动 释放 。 
VALUE 和 ID 的 互相 转换 


ID 在 Ruby 层 面 上 是 Symbol 类 的 实例 ，"string" .intern 会 返回 对 应 的 |D。 这 个 String#intern 的 
实体 就 是 rb_str_intern()。 


Wrb_str_intern() 


2996 static VALUE 
2997 rb_str_intern(str) 


2998 VALUE str,; 

2999 { 

3000 ID id; 

3001 

3002 if (!RSTRING(str)->ptr || RSTRING(str)->len == 0) { 
3003 rb_raise(rb_eArgError, "interning empty string"); 
3004 } 

3005 If (strlen(RSTRING(str)->ptr) != RSTRING(str)->len) 
3006 rb_raise(rb_eArgError, "string contains ‘\\0'"); 
3007 id = rb_intern(RSTRING(str)->ptr); 

3008 return ID2SYM(id); 

3009 } 


(string.c) 
这 个 函数 作为 ruby 的 类 库 的 代码 例子 来 说 真是 信 手 牛 来 。 注 意 其 中 使 用 RSTRING() 强 制 转 换 
来 访问 构造 体 成 员 的 技巧 。 


读 读 代 码 吧 。 首 先 rb_raise() 只 是 出 错 处 理 所 以 先 无 视 。 这 个 函数 里 面 有 刚才 刚 解 释 过 的 
rb_intern(),ID2SYM().ID2SYM() 是 将 ID 转换 成 Symbol 的 宏 。 


这 个 操作 的 逆向 是 Symbol#to s。 其 实体 函数 为 sym_ to _S。 


Wsym_to_s() 


522 static VALUE 
523 sym_to_s(sym) 


524 VALUE sym; 
525 { 
526 return rb_str_new2(rb_id2name(SYM2ID(Sym) ) ) ， 
527 } 
(object.c) 


SYM2ID 是 将 Symbol(VALUE) 转 换 成 ID 的 的 宏 。 


看 上 去 很 不 常见 的 写法 ， 应 该 注意 的 是 内 存 处 理 相关 的 地 方 。rb id2name() 返 回 一 个 不 允许 
free() 的 char, rb_str_ new2() 将 参数 char 找 贝 使 用 (不 会 改变 参数 )。 因 为 贯彻 了 这 个 方针 所 以 可 
以 写成 函数 套 函 数 的 连锁 形式 。 


人 和 


(第 三 章 完 ) 


